spacemeshos · fasmat · Jul 3, 2024 · Jul 3, 2024 · Jul 3, 2024 · Jul 3, 2024
@@ -17,6 +17,7 @@ import (
 	dto "github.com/prometheus/client_model/go"
 	"go.uber.org/zap"
 	"golang.org/x/sync/errgroup"
+	"golang.org/x/sync/semaphore"
 	"golang.org/x/time/rate"
 
 	"github.com/spacemeshos/go-spacemesh/codec"
@@ -156,6 +157,10 @@ type Server struct {
 	decayingTagSpec     *DecayingTagSpec
 	decayingTag         connmgr.DecayingTag
 
+	limit *rate.Limiter
+	sem   *semaphore.Weighted
+	queue chan request
+
 	metrics *tracker // metrics can be nil
 
 	h Host
@@ -174,6 +179,8 @@ func New(h Host, proto string, handler StreamHandler, opts ...Opt) *Server {
 		queueSize:           1000,
 		requestsPerInterval: 100,
 		interval:            time.Second,
+
+		queue: make(chan request),
 	}
 	for _, opt := range opts {
 		opt(srv)
@@ -195,6 +202,19 @@ func New(h Host, proto string, handler StreamHandler, opts ...Opt) *Server {
 		}
 	}
 
+	srv.limit = rate.NewLimiter(
+		rate.Every(srv.interval/time.Duration(srv.requestsPerInterval)),
+		srv.requestsPerInterval,
+	)
+	srv.sem = semaphore.NewWeighted(int64(srv.queueSize))
+	if srv.metrics != nil {
+		srv.metrics.targetQueue.Set(float64(srv.queueSize))
+		srv.metrics.targetRps.Set(float64(srv.limit.Limit()))
+	}
+	srv.h.SetStreamHandler(protocol.ID(srv.protocol), func(stream network.Stream) {
+		srv.queue <- request{stream: stream, received: time.Now()}
+	})
+
 	return srv
 }
 
@@ -204,45 +224,35 @@ type request struct {
 }
 
 func (s *Server) Run(ctx context.Context) error {
-	limit := rate.NewLimiter(rate.Every(s.interval/time.Duration(s.requestsPerInterval)), s.requestsPerInterval)
-	queue := make(chan request, s.queueSize)
-	if s.metrics != nil {
-		s.metrics.targetQueue.Set(float64(s.queueSize))
-		s.metrics.targetRps.Set(float64(limit.Limit()))
-	}
-	s.h.SetStreamHandler(protocol.ID(s.protocol), func(stream network.Stream) {
-		select {
-		case queue <- request{stream: stream, received: time.Now()}:
-		default:
-			if s.metrics != nil {
-				s.metrics.dropped.Inc()
-			}
-			stream.Close()
-		}
-	})
-
 	var eg errgroup.Group
-	eg.SetLimit(s.queueSize * 2)
 	for {
 		select {
 		case <-ctx.Done():
 			eg.Wait()
 			return nil
-		case req := <-queue:
+		case req := <-s.queue:
+			if !s.sem.TryAcquire(1) {
+				if s.metrics != nil {
+					s.metrics.dropped.Inc()
+				}
+				req.stream.Close()
+				continue
+			}
 			if s.metrics != nil {
-				s.metrics.queue.Set(float64(len(queue)))
+				s.metrics.queue.Set(float64(s.queueSize))
 				s.metrics.accepted.Inc()
 			}
 			if s.metrics != nil {
 				s.metrics.inQueueLatency.Observe(time.Since(req.received).Seconds())
 			}
-			if err := limit.Wait(ctx); err != nil {
+			if err := s.limit.Wait(ctx); err != nil {
 				eg.Wait()
 				return nil
 			}
 			ctx, cancel := context.WithCancel(ctx)
 			eg.Go(func() error {
 				<-ctx.Done()
+				s.sem.Release(1)
 				req.stream.Close()
 				return nil
 			})

@@ -3,7 +3,7 @@ package server
 import (
 	"context"
 	"errors"
-	"sync/atomic"
+	"sync"
 	"testing"
 	"time"
 
@@ -172,25 +172,28 @@ func TestServer(t *testing.T) {
 	})
 }
 
-func TestQueued(t *testing.T) {
+func Test_Queued(t *testing.T) {
 	mesh, err := mocknet.FullMeshConnected(2)
 	require.NoError(t, err)
 
 	var (
-		total            = 100
-		proto            = "test"
-		success, failure atomic.Int64
-		wait             = make(chan struct{}, total)
+		queueSize = 10
+		proto     = "test"
+		stop      = make(chan struct{})
+		wg        sync.WaitGroup
 	)
 
+	wg.Add(queueSize)
 	client := New(wrapHost(t, mesh.Hosts()[0]), proto, nil)
 	srv := New(
 		wrapHost(t, mesh.Hosts()[1]),
 		proto,
 		WrapHandler(func(_ context.Context, msg []byte) ([]byte, error) {
+			wg.Done()
+			<-stop
 			return msg, nil
 		}),
-		WithQueueSize(total/3),
+		WithQueueSize(queueSize),
 		WithRequestsPerInterval(50, time.Second),
 		WithMetrics(),
 	)
@@ -205,23 +208,24 @@ func TestQueued(t *testing.T) {
 	t.Cleanup(func() {
 		assert.NoError(t, eg.Wait())
 	})
-	for i := 0; i < total; i++ {
-		eg.Go(func() error {
-			if _, err := client.Request(ctx, mesh.Hosts()[1].ID(), []byte("ping")); err != nil {
-				failure.Add(1)
-			} else {
-				success.Add(1)
-			}
-			wait <- struct{}{}
+	var reqEq errgroup.Group
+	for i := 0; i < queueSize; i++ { // fill the queue with requests
+		reqEq.Go(func() error {
+			resp, err := client.Request(ctx, mesh.Hosts()[1].ID(), []byte("ping"))
+			require.NoError(t, err)
+			require.Equal(t, []byte("ping"), resp)
 			return nil
 		})
 	}
-	for i := 0; i < total; i++ {
-		<-wait
+	wg.Wait()
+
+	for i := 0; i < queueSize; i++ { // queue is full, requests fail
+		_, err := client.Request(ctx, mesh.Hosts()[1].ID(), []byte("ping"))
+		require.Error(t, err)
 	}
-	require.NotZero(t, failure.Load())
-	require.Greater(t, int(success.Load()), total/2)
-	t.Log(success.Load())
+
+	close(stop)
+	require.NoError(t, reqEq.Wait())
 }
 
 func FuzzResponseConsistency(f *testing.F) {