fix(scaletest): wait for mock AI provider reload

2026-06-02 20:48:20 +00:00 · 2026-06-02 13:18:13 +00:00
parent 8aac8380ce
commit 2769d5f125
4 changed files with 300 additions and 18 deletions
@@ -12,6 +12,7 @@ import (
 	"cdr.dev/slog/v3"
 	"github.com/coder/coder/v2/codersdk"
 	"github.com/coder/coder/v2/scaletest/llmmock"
 	"github.com/coder/retry"
 )
@@ -23,7 +24,7 @@ const (
 	scaletestModelName             = "scaletest-model"
 	scaletestModelDisplayName      = "Scaletest Model"
 	scaletestModelContextLimit     = int64(4096)
-	scaletestAIProviderProbePath   = "/api/v2/aibridge/" + scaletestAIProviderName + "/v1/chat/completions"
+	scaletestAIProviderProbePath   = "/api/v2/aibridge/" + scaletestAIProviderName + "/v1/models"
 	scaletestAIProviderProbeWait   = 15 * time.Second
 	scaletestAIProviderProbePeriod = 100 * time.Millisecond
 )
@@ -67,7 +68,7 @@ func EnsureScaletestModelConfig(ctx context.Context, client *codersdk.Client, lo
 	}
 	if providerAction != scaletestAIProviderActionReused {
-		if err := waitForScaletestAIProviderRoute(ctx, client, logger); err != nil {
+		if err := waitForScaletestAIProviderRoute(ctx, client, logger, llmMockURL); err != nil {
 			return uuid.Nil, xerrors.Errorf("wait for mock LLM provider reload: %w", err)
 		}
 	}
@@ -75,7 +76,7 @@ func EnsureScaletestModelConfig(ctx context.Context, client *codersdk.Client, lo
 	return ensureScaletestChatModelConfig(ctx, codersdk.NewExperimentalClient(client), logger, provider)
 }
-func waitForScaletestAIProviderRoute(ctx context.Context, client *codersdk.Client, logger slog.Logger) error {
+func waitForScaletestAIProviderRoute(ctx context.Context, client *codersdk.Client, logger slog.Logger, llmMockURL string) error {
 	deploymentConfig, err := client.DeploymentConfig(ctx)
 	if err != nil {
 		return xerrors.Errorf("get deployment config: %w", err)
@@ -86,38 +87,39 @@ func waitForScaletestAIProviderRoute(ctx context.Context, client *codersdk.Clien
 		return nil
 	}
 	expectedMarker, err := llmmock.ProbeMarkerForBaseURL(llmMockURL)
 	if err != nil {
 		return xerrors.Errorf("build mock LLM provider probe marker: %w", err)
 	}
 	logger.Info(ctx, "waiting for mock LLM provider reload", slog.F("provider_name", scaletestAIProviderName))
 	ctx, cancel := context.WithTimeout(ctx, scaletestAIProviderProbeWait)
 	defer cancel()
 	var lastStatus int
 	var lastBody string
 	for retrier := retry.New(scaletestAIProviderProbePeriod, scaletestAIProviderProbePeriod); retrier.Wait(ctx); {
-		res, err := client.Request(ctx, http.MethodPost, scaletestAIProviderProbePath, map[string]any{
+		res, err := client.Request(ctx, http.MethodGet, scaletestAIProviderProbePath, nil, func(r *http.Request) {
 			"model": scaletestModelName,
 			"messages": []map[string]string{{
 				"role":    "user",
 				"content": "ping",
 			}},
 			"stream": false,
 		}, func(r *http.Request) {
 			r.Header.Set("Authorization", "Bearer "+client.SessionToken())
 		})
 		if err != nil {
-			return err
+			return xerrors.Errorf("probe mock LLM provider route: %w", err)
 		}
 		body, err := io.ReadAll(io.LimitReader(res.Body, 4096))
 		_ = res.Body.Close()
 		if err != nil {
 			return xerrors.Errorf("read probe response: %w", err)
 		}
-		if res.StatusCode == http.StatusOK {
+		lastStatus = res.StatusCode
 		lastBody = strings.TrimSpace(string(body))
 		if res.StatusCode == http.StatusOK && strings.Contains(lastBody, expectedMarker) {
 			return nil
 		}
-		if res.StatusCode != http.StatusNotFound || !strings.Contains(string(body), "route not supported") {
+		logger.Debug(ctx, "mock LLM provider route is not ready",
-			return xerrors.Errorf("status %d: %s", res.StatusCode, strings.TrimSpace(string(body)))
+			slog.F("status_code", res.StatusCode),
-		}
+		)
 		logger.Debug(ctx, "mock LLM provider route is not ready")
 	}
-	return xerrors.Errorf("timed out waiting for mock LLM provider route")
+	return xerrors.Errorf("timed out waiting for mock LLM provider route to report marker %q (last status %d: %s)", expectedMarker, lastStatus, lastBody)
 }
 func ensureScaletestChatModelConfig(ctx context.Context, client *codersdk.ExperimentalClient, logger slog.Logger, provider codersdk.AIProvider) (uuid.UUID, error) {
@@ -0,0 +1,192 @@
 package chat
 import (
 	"context"
 	"encoding/json"
 	"net/http"
 	"net/http/httptest"
 	"net/url"
 	"sync/atomic"
 	"testing"
 	"github.com/google/uuid"
 	"github.com/stretchr/testify/require"
 	"github.com/coder/coder/v2/codersdk"
 	"github.com/coder/coder/v2/scaletest/llmmock"
 )
 func TestEnsureScaletestChatModelConfig(t *testing.T) {
 	t.Parallel()
 	ctx := context.Background()
 	providerID := uuid.MustParse("44444444-4444-4444-4444-444444444444")
 	wrongProviderID := uuid.MustParse("55555555-5555-5555-5555-555555555555")
 	matchingConfigID := uuid.MustParse("66666666-6666-6666-6666-666666666666")
 	createdConfigID := uuid.MustParse("77777777-7777-7777-7777-777777777777")
 	provider := codersdk.AIProvider{ID: providerID}
 	t.Run("ReusesMatchingProviderAndModel", func(t *testing.T) {
 		t.Parallel()
 		client := codersdk.NewExperimentalClient(newProviderTestClient(t, http.HandlerFunc(func(rw http.ResponseWriter, r *http.Request) {
 			switch {
 			case r.Method == http.MethodGet && r.URL.Path == "/api/experimental/chats/model-configs":
 				writeJSON(t, rw, http.StatusOK, []codersdk.ChatModelConfig{
 					{
 						ID:           uuid.MustParse("88888888-8888-8888-8888-888888888888"),
 						AIProviderID: &wrongProviderID,
 						Model:        scaletestModelName,
 						Enabled:      true,
 					},
 					{
 						ID:           matchingConfigID,
 						AIProviderID: &providerID,
 						Model:        scaletestModelName,
 						Enabled:      true,
 					},
 				})
 			default:
 				t.Fatalf("unexpected request %s %s", r.Method, r.URL.Path)
 			}
 		})))
 		gotID, err := ensureScaletestChatModelConfig(ctx, client, testLogger(), provider)
 		require.NoError(t, err)
 		require.Equal(t, matchingConfigID, gotID)
 	})
 	t.Run("CreatesWhenNoConfigMatches", func(t *testing.T) {
 		t.Parallel()
 		var createReq codersdk.CreateChatModelConfigRequest
 		client := codersdk.NewExperimentalClient(newProviderTestClient(t, http.HandlerFunc(func(rw http.ResponseWriter, r *http.Request) {
 			switch {
 			case r.Method == http.MethodGet && r.URL.Path == "/api/experimental/chats/model-configs":
 				writeJSON(t, rw, http.StatusOK, []codersdk.ChatModelConfig{})
 			case r.Method == http.MethodPost && r.URL.Path == "/api/experimental/chats/model-configs":
 				require.NoError(t, json.NewDecoder(r.Body).Decode(&createReq))
 				writeJSON(t, rw, http.StatusCreated, codersdk.ChatModelConfig{
 					ID:           createdConfigID,
 					AIProviderID: &providerID,
 					Model:        scaletestModelName,
 					Enabled:      true,
 				})
 			default:
 				t.Fatalf("unexpected request %s %s", r.Method, r.URL.Path)
 			}
 		})))
 		gotID, err := ensureScaletestChatModelConfig(ctx, client, testLogger(), provider)
 		require.NoError(t, err)
 		require.Equal(t, createdConfigID, gotID)
 		require.Equal(t, &providerID, createReq.AIProviderID)
 		require.Equal(t, scaletestModelName, createReq.Model)
 		require.Equal(t, scaletestModelDisplayName, createReq.DisplayName)
 		require.NotNil(t, createReq.Enabled)
 		require.True(t, *createReq.Enabled)
 		require.NotNil(t, createReq.IsDefault)
 		require.False(t, *createReq.IsDefault)
 		require.NotNil(t, createReq.ContextLimit)
 		require.Equal(t, scaletestModelContextLimit, *createReq.ContextLimit)
 	})
 }
 func TestWaitForScaletestAIProviderRoute(t *testing.T) {
 	t.Parallel()
 	llmMockURL := "http://new.example.test/v1"
 	expectedMarker, err := llmmock.ProbeMarkerForBaseURL(llmMockURL)
 	require.NoError(t, err)
 	t.Run("WaitsUntilExpectedMarker", func(t *testing.T) {
 		t.Parallel()
 		var probeCount atomic.Int64
 		client := newProviderTestClient(t, http.HandlerFunc(func(rw http.ResponseWriter, r *http.Request) {
 			switch {
 			case r.Method == http.MethodGet && r.URL.Path == "/api/v2/deployment/config":
 				writeDeploymentConfig(t, rw, true)
 			case r.Method == http.MethodGet && r.URL.Path == scaletestAIProviderProbePath:
 				require.Equal(t, "Bearer test-session", r.Header.Get("Authorization"))
 				switch probeCount.Add(1) {
 				case 1:
 					writeJSON(t, rw, http.StatusOK, map[string]string{"scaletest_llm_mock": "coder-scaletest-llm-mock:old.example.test/v1"})
 				case 2:
 					writeText(rw, http.StatusBadGateway, "upstream proxy error")
 				case 3:
 					writeText(rw, http.StatusNotFound, "route not supported")
 				default:
 					writeJSON(t, rw, http.StatusOK, map[string]string{"scaletest_llm_mock": expectedMarker})
 				}
 			default:
 				t.Fatalf("unexpected request %s %s", r.Method, r.URL.Path)
 			}
 		}))
 		err := waitForScaletestAIProviderRoute(context.Background(), client, testLogger(), llmMockURL)
 		require.NoError(t, err)
 		require.Equal(t, int64(4), probeCount.Load())
 	})
 	t.Run("SkipsWhenAIGatewayRoutingDisabled", func(t *testing.T) {
 		t.Parallel()
 		client := newProviderTestClient(t, http.HandlerFunc(func(rw http.ResponseWriter, r *http.Request) {
 			switch {
 			case r.Method == http.MethodGet && r.URL.Path == "/api/v2/deployment/config":
 				writeDeploymentConfig(t, rw, false)
 			case r.URL.Path == scaletestAIProviderProbePath:
 				t.Fatal("probe route should not be called when AI Gateway routing is disabled")
 			default:
 				t.Fatalf("unexpected request %s %s", r.Method, r.URL.Path)
 			}
 		}))
 		err := waitForScaletestAIProviderRoute(context.Background(), client, testLogger(), llmMockURL)
 		require.NoError(t, err)
 	})
 }
 func newProviderTestClient(t *testing.T, handler http.Handler) *codersdk.Client {
 	t.Helper()
 	srv := httptest.NewServer(handler)
 	t.Cleanup(srv.Close)
 	serverURL, err := url.Parse(srv.URL)
 	require.NoError(t, err)
 	client := codersdk.New(serverURL)
 	client.SetSessionToken("test-session")
 	return client
 }
 func writeDeploymentConfig(t *testing.T, rw http.ResponseWriter, enabled bool) {
 	t.Helper()
 	writeJSON(t, rw, http.StatusOK, map[string]any{
 		"config": map[string]any{
 			"ai": map[string]any{
 				"bridge": map[string]any{
 					"enabled": enabled,
 				},
 				"chat": map[string]any{
 					"ai_gateway_routing_enabled": enabled,
 				},
 			},
 		},
 	})
 }
 func writeJSON(t *testing.T, rw http.ResponseWriter, status int, body any) {
 	t.Helper()
 	rw.Header().Set("Content-Type", "application/json")
 	rw.WriteHeader(status)
 	require.NoError(t, json.NewEncoder(rw).Encode(body))
 }
 func writeText(rw http.ResponseWriter, status int, body string) {
 	rw.Header().Set("Content-Type", "text/plain")
 	rw.WriteHeader(status)
 	_, _ = rw.Write([]byte(body))
 }
@@ -7,6 +7,7 @@ import (
 	"fmt"
 	"net"
 	"net/http"
 	"net/url"
 	"strings"
 	"time"
@@ -50,6 +51,24 @@ type Config struct {
 	TraceEnable bool
 }
 const probeMarkerPrefix = "coder-scaletest-llm-mock:"
 // ProbeMarkerForBaseURL returns the readiness marker emitted by the mock for a provider base URL.
 func ProbeMarkerForBaseURL(rawURL string) (string, error) {
 	parsed, err := url.Parse(rawURL)
 	if err != nil {
 		return "", xerrors.Errorf("parse LLM mock URL: %w", err)
 	}
 	if parsed.Host == "" {
 		return "", xerrors.Errorf("LLM mock URL %q is missing a host", rawURL)
 	}
 	return probeMarker(parsed.Host, parsed.Path), nil
 }
 func probeMarker(host string, basePath string) string {
 	return probeMarkerPrefix + host + strings.TrimRight(basePath, "/")
 }
 type llmRequest struct {
 	Model  string `json:"model"`
 	Stream bool   `json:"stream,omitempty"`
@@ -172,6 +191,7 @@ func (s *Server) APIAddress() string {
 func (s *Server) startAPIServer(ctx context.Context) error {
 	mux := http.NewServeMux()
 	mux.HandleFunc("GET /v1/models", s.handleOpenAIModels)
 	mux.HandleFunc("POST /v1/chat/completions", s.handleOpenAI)
 	mux.HandleFunc("POST /v1/responses", s.handleResponses)
 	mux.HandleFunc("POST /v1/messages", s.handleAnthropic)
@@ -201,6 +221,32 @@ func (s *Server) startAPIServer(ctx context.Context) error {
 	return nil
 }
 func (s *Server) handleOpenAIModels(w http.ResponseWriter, r *http.Request) {
 	pproflabel.Do(r.Context(), pproflabel.Service("llm-mock"), func(ctx context.Context) {
 		s.handleOpenAIModelsWithLabels(w, r.WithContext(ctx))
 	})
 }
 func (s *Server) handleOpenAIModelsWithLabels(w http.ResponseWriter, r *http.Request) {
 	basePath := strings.TrimSuffix(r.URL.Path, "/")
 	basePath = strings.TrimSuffix(basePath, "/models")
 	resp := struct {
 		Object           string     `json:"object"`
 		Data             []struct{} `json:"data"`
 		ScaletestLLMMock string     `json:"scaletest_llm_mock"`
 	}{
 		Object:           "list",
 		Data:             []struct{}{},
 		ScaletestLLMMock: probeMarker(r.Host, basePath),
 	}
 	w.Header().Set("Content-Type", "application/json")
 	w.WriteHeader(http.StatusOK)
 	if err := json.NewEncoder(w).Encode(resp); err != nil {
 		s.logger.Error(r.Context(), "failed to write OpenAI models response", slog.Error(err))
 	}
 }
 func (s *Server) handleOpenAI(w http.ResponseWriter, r *http.Request) {
 	pproflabel.Do(r.Context(), pproflabel.Service("llm-mock"), func(ctx context.Context) {
 		s.handleOpenAIWithLabels(w, r.WithContext(ctx))
@@ -0,0 +1,42 @@
 package llmmock_test
 import (
 	"context"
 	"io"
 	"net/http"
 	"testing"
 	"github.com/stretchr/testify/require"
 	"cdr.dev/slog/v3"
 	"cdr.dev/slog/v3/sloggers/sloghuman"
 	"github.com/coder/coder/v2/scaletest/llmmock"
 )
 func TestServerOpenAIModelsReportsProbeMarker(t *testing.T) {
 	t.Parallel()
 	ctx := context.Background()
 	server := new(llmmock.Server)
 	err := server.Start(ctx, llmmock.Config{
 		Address: "127.0.0.1:0",
 		Logger:  slog.Make(sloghuman.Sink(io.Discard)).Leveled(slog.LevelDebug),
 	})
 	require.NoError(t, err)
 	t.Cleanup(func() {
 		require.NoError(t, server.Stop())
 	})
 	req, err := http.NewRequestWithContext(ctx, http.MethodGet, server.APIAddress()+"/v1/models", nil)
 	require.NoError(t, err)
 	res, err := http.DefaultClient.Do(req)
 	require.NoError(t, err)
 	defer res.Body.Close()
 	require.Equal(t, http.StatusOK, res.StatusCode)
 	body, err := io.ReadAll(res.Body)
 	require.NoError(t, err)
 	expectedMarker, err := llmmock.ProbeMarkerForBaseURL(server.APIAddress() + "/v1")
 	require.NoError(t, err)
 	require.Contains(t, string(body), expectedMarker)
 }