From ea5f522c8bea4cbe7b1c6b80d9cb3c401907515d Mon Sep 17 00:00:00 2001
From: "Andrew X. Shah" <drewshah0@gmail.com>
Date: Sun, 23 Jul 2023 05:17:47 -0600
Subject: [PATCH] fix(layer): resolve tensor shapes for initialization &
 feed_forward

Broadcast biases to weighted_sum shape to allow element-wise addition.
---
 src/layer.rs | 17 ++++++++++-------
 1 file changed, 10 insertions(+), 7 deletions(-)

diff --git a/src/layer.rs b/src/layer.rs
index 21d966f..a388141 100644
--- a/src/layer.rs
+++ b/src/layer.rs
@@ -24,17 +24,17 @@ impl Layer {
     /// ```
     /// # use engram::{Layer, Initializer};
     /// let layer = Layer::new(2, 3, &Initializer::Xavier);
-    /// assert_eq!(layer.weights.shape(), (2, 3));
+    /// assert_eq!(layer.weights.shape(), (3, 2));
     /// assert_eq!(layer.biases.shape(), (3, 1));
-    /// assert_eq!(layer.d_weights.shape(), (2, 3));
-    /// assert_eq!(layer.d_biases.shape(), (1, 3));
+    /// assert_eq!(layer.d_weights.shape(), (3, 2));
+    /// assert_eq!(layer.d_biases.shape(), (3, 1));
     /// assert!(layer.output.is_none());
     /// ```
     pub fn new(f_in: usize, f_out: usize, initializer: &Initializer) -> Layer {
-        let weights = Tensor::initialize(f_in, f_out, initializer);
+        let weights = Tensor::initialize(f_out, f_in, initializer);
         let biases = Tensor::initialize(f_out, 1, initializer);
-        let d_weights = Tensor::zeros(f_in, f_out);
-        let d_biases = Tensor::zeros(1, f_out);
+        let d_weights = Tensor::zeros(f_out, f_in);
+        let d_biases = Tensor::zeros(f_out, 1);
         let output = None;
 
         Layer {
@@ -58,7 +58,10 @@ impl Layer {
     /// assert_eq!(output.shape(), (3, 3));
     /// ```
     pub fn feed_forward(&mut self, inputs: &Tensor, activation: Activation) -> Tensor {
-        let output = activation.apply_tensor(&(self.weights).matmul(inputs).add(&self.biases));
+        let weighted_sum = inputs.matmul(&self.weights.transpose());
+        let biases_broadcasted = self.biases.broadcast_to(weighted_sum.shape());
+        let output = activation.apply_tensor(&weighted_sum.add(&biases_broadcasted));
+
         self.output = Some(output.clone());
         output
     }