refactor: split RelayTextHelper function

2025-10-16 16:13:56 +00:00 · 2024-01-28 19:13:11 +08:00
parent ea407f0054
commit b9d3cb0c45
5 changed files with 189 additions and 135 deletions
--- a/relay/controller/text.go
+++ b/relay/controller/text.go
@@ -1,115 +1,61 @@
 package controller

 import (
-	"context"
-	"errors"
 	"fmt"
 	"github.com/gin-gonic/gin"
-	"math"
 	"net/http"
 	"one-api/common"
-	"one-api/common/config"
 	"one-api/common/logger"
-	"one-api/model"
 	"one-api/relay/channel/openai"
 	"one-api/relay/constant"
 	"one-api/relay/util"
 	"strings"
 )

-func RelayTextHelper(c *gin.Context, relayMode int) *openai.ErrorWithStatusCode {
+func RelayTextHelper(c *gin.Context) *openai.ErrorWithStatusCode {
 	ctx := c.Request.Context()
 	meta := util.GetRelayMeta(c)
-	var textRequest openai.GeneralOpenAIRequest
-	err := common.UnmarshalBodyReusable(c, &textRequest)
-	if err != nil {
-		return openai.ErrorWrapper(err, "bind_request_body_failed", http.StatusBadRequest)
-	}
-	if relayMode == constant.RelayModeModerations && textRequest.Model == "" {
-		textRequest.Model = "text-moderation-latest"
-	}
-	if relayMode == constant.RelayModeEmbeddings && textRequest.Model == "" {
-		textRequest.Model = c.Param("model")
-	}
-	err = util.ValidateTextRequest(&textRequest, relayMode)
+	// get & validate textRequest
+	textRequest, err := getAndValidateTextRequest(c, meta.Mode)
 	if err != nil {
+		logger.Errorf(ctx, "getAndValidateTextRequest failed: %s", err.Error())
 		return openai.ErrorWrapper(err, "invalid_text_request", http.StatusBadRequest)
 	}
+	// map model name
 	var isModelMapped bool
 	textRequest.Model, isModelMapped = util.GetMappedModelName(textRequest.Model, meta.ModelMapping)
-	apiType := constant.ChannelType2APIType(meta.ChannelType)
-	fullRequestURL, err := GetRequestURL(c.Request.URL.String(), apiType, relayMode, meta, &textRequest)
-	if err != nil {
-		logger.Error(ctx, fmt.Sprintf("util.GetRequestURL failed: %s", err.Error()))
-		return openai.ErrorWrapper(fmt.Errorf("util.GetRequestURL failed"), "get_request_url_failed", http.StatusInternalServerError)
-	}
-	var promptTokens int
-	var completionTokens int
-	switch relayMode {
-	case constant.RelayModeChatCompletions:
-		promptTokens = openai.CountTokenMessages(textRequest.Messages, textRequest.Model)
-	case constant.RelayModeCompletions:
-		promptTokens = openai.CountTokenInput(textRequest.Prompt, textRequest.Model)
-	case constant.RelayModeModerations:
-		promptTokens = openai.CountTokenInput(textRequest.Input, textRequest.Model)
-	}
-	preConsumedTokens := config.PreConsumedQuota
-	if textRequest.MaxTokens != 0 {
-		preConsumedTokens = promptTokens + textRequest.MaxTokens
-	}
+	// get model ratio & group ratio
 	modelRatio := common.GetModelRatio(textRequest.Model)
 	groupRatio := common.GetGroupRatio(meta.Group)
 	ratio := modelRatio * groupRatio
-	preConsumedQuota := int(float64(preConsumedTokens) * ratio)
-	userQuota, err := model.CacheGetUserQuota(meta.UserId)
-	if err != nil {
-		return openai.ErrorWrapper(err, "get_user_quota_failed", http.StatusInternalServerError)
+	// pre-consume quota
+	promptTokens := getPromptTokens(textRequest, meta.Mode)
+	preConsumedQuota, bizErr := preConsumeQuota(ctx, textRequest, promptTokens, ratio, meta)
+	if bizErr != nil {
+		logger.Warnf(ctx, "preConsumeQuota failed: %+v", *bizErr)
+		return bizErr
 	}
-	if userQuota-preConsumedQuota < 0 {
-		return openai.ErrorWrapper(errors.New("user quota is not enough"), "insufficient_user_quota", http.StatusForbidden)
-	}
-	err = model.CacheDecreaseUserQuota(meta.UserId, preConsumedQuota)
-	if err != nil {
-		return openai.ErrorWrapper(err, "decrease_user_quota_failed", http.StatusInternalServerError)
-	}
-	if userQuota > 100*preConsumedQuota {
-		// in this case, we do not pre-consume quota
-		// because the user has enough quota
-		preConsumedQuota = 0
-		logger.Info(c.Request.Context(), fmt.Sprintf("user %d has enough quota %d, trusted and no need to pre-consume", meta.UserId, userQuota))
-	}
-	if preConsumedQuota > 0 {
-		err := model.PreConsumeTokenQuota(meta.TokenId, preConsumedQuota)
-		if err != nil {
-			return openai.ErrorWrapper(err, "pre_consume_token_quota_failed", http.StatusForbidden)
-		}
-	}
-	requestBody, err := GetRequestBody(c, textRequest, isModelMapped, apiType, relayMode)
+
+	// get request body
+	requestBody, err := GetRequestBody(c, *textRequest, isModelMapped, meta.APIType, meta.Mode)
 	if err != nil {
 		return openai.ErrorWrapper(err, "get_request_body_failed", http.StatusInternalServerError)
 	}
-	var req *http.Request
+	// do request
 	var resp *http.Response
 	isStream := textRequest.Stream
+	if meta.APIType != constant.APITypeXunfei { // cause xunfei use websocket
+		fullRequestURL, err := GetRequestURL(c.Request.URL.String(), meta, textRequest)
+		if err != nil {
+			logger.Error(ctx, fmt.Sprintf("util.GetRequestURL failed: %s", err.Error()))
+			return openai.ErrorWrapper(fmt.Errorf("util.GetRequestURL failed"), "get_request_url_failed", http.StatusInternalServerError)
+		}

-	if apiType != constant.APITypeXunfei { // cause xunfei use websocket
-		req, err = http.NewRequest(c.Request.Method, fullRequestURL, requestBody)
-		if err != nil {
-			return openai.ErrorWrapper(err, "new_request_failed", http.StatusInternalServerError)
-		}
-		SetupRequestHeaders(c, req, apiType, meta, isStream)
-		resp, err = util.HTTPClient.Do(req)
+		resp, err = doRequest(ctx, c, meta, isStream, fullRequestURL, requestBody)
 		if err != nil {
+			logger.Errorf(ctx, "doRequest failed: %s", err.Error())
 			return openai.ErrorWrapper(err, "do_request_failed", http.StatusInternalServerError)
 		}
-		err = req.Body.Close()
-		if err != nil {
-			return openai.ErrorWrapper(err, "close_request_body_failed", http.StatusInternalServerError)
-		}
-		err = c.Request.Body.Close()
-		if err != nil {
-			return openai.ErrorWrapper(err, "close_request_body_failed", http.StatusInternalServerError)
-		}
 		isStream = isStream || strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")

 		if resp.StatusCode != http.StatusOK {
@@ -117,57 +63,14 @@ func RelayTextHelper(c *gin.Context, relayMode int) *openai.ErrorWithStatusCode
 			return util.RelayErrorHandler(resp)
 		}
 	}
-
-	var respErr *openai.ErrorWithStatusCode
-	var usage *openai.Usage
-
-	defer func(ctx context.Context) {
-		// Why we use defer here? Because if error happened, we will have to return the pre-consumed quota.
-		if respErr != nil {
-			logger.Errorf(ctx, "respErr is not nil: %+v", respErr)
-			util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)
-			return
-		}
-		if usage == nil {
-			logger.Error(ctx, "usage is nil, which is unexpected")
-			return
-		}
-
-		go func() {
-			quota := 0
-			completionRatio := common.GetCompletionRatio(textRequest.Model)
-			promptTokens = usage.PromptTokens
-			completionTokens = usage.CompletionTokens
-			quota = int(math.Ceil((float64(promptTokens) + float64(completionTokens)*completionRatio) * ratio))
-			if ratio != 0 && quota <= 0 {
-				quota = 1
-			}
-			totalTokens := promptTokens + completionTokens
-			if totalTokens == 0 {
-				// in this case, must be some error happened
-				// we cannot just return, because we may have to return the pre-consumed quota
-				quota = 0
-			}
-			quotaDelta := quota - preConsumedQuota
-			err := model.PostConsumeTokenQuota(meta.TokenId, quotaDelta)
-			if err != nil {
-				logger.Error(ctx, "error consuming token remain quota: "+err.Error())
-			}
-			err = model.CacheUpdateUserQuota(meta.UserId)
-			if err != nil {
-				logger.Error(ctx, "error update user quota cache: "+err.Error())
-			}
-			if quota != 0 {
-				logContent := fmt.Sprintf("模型倍率 %.2f，分组倍率 %.2f", modelRatio, groupRatio)
-				model.RecordConsumeLog(ctx, meta.UserId, meta.ChannelId, promptTokens, completionTokens, textRequest.Model, meta.TokenName, quota, logContent)
-				model.UpdateUserUsedQuotaAndRequestCount(meta.UserId, quota)
-				model.UpdateChannelUsedQuota(meta.ChannelId, quota)
-			}
-		}()
-	}(ctx)
-	usage, respErr = DoResponse(c, &textRequest, resp, relayMode, apiType, isStream, promptTokens)
+	// do response
+	usage, respErr := DoResponse(c, textRequest, resp, meta.Mode, meta.APIType, isStream, promptTokens)
 	if respErr != nil {
+		logger.Errorf(ctx, "respErr is not nil: %+v", respErr)
+		util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)
 		return respErr
 	}
+	// post-consume quota
+	go postConsumeQuota(ctx, usage, meta, textRequest, ratio, preConsumedQuota, modelRatio, groupRatio)
 	return nil
 }