V4.8.17 feature (#3493)

* split tokens into input and output (#3477) * split tokens into input and output * query extension & tool call & question guide * fix * perf: input and output tokens * perf: tool call if else * perf: remove code * fix: extract usage count * fix: qa usage count --------- Co-authored-by: heheer <heheer@sealos.io>
2025-10-22 11:55:07 +00:00 · 2024-12-30 10:13:25 +08:00
parent da2831b948
commit 50bf7f9a3b
46 changed files with 467 additions and 230 deletions
--- a/packages/service/core/ai/functions/queryExtension.ts
+++ b/packages/service/core/ai/functions/queryExtension.ts
@@ -1,7 +1,7 @@
 import { replaceVariable } from '@fastgpt/global/common/string/tools';
 import { createChatCompletion } from '../config';
 import { ChatItemType } from '@fastgpt/global/core/chat/type';
-import { countGptMessagesTokens } from '../../../common/string/tiktoken/index';
+import { countGptMessagesTokens, countPromptTokens } from '../../../common/string/tiktoken/index';
 import { chatValue2RuntimePrompt } from '@fastgpt/global/core/chat/adapt';
 import { getLLMModel } from '../model';
 import { llmCompletionsBodyFormat } from '../utils';
@@ -121,7 +121,8 @@ export const queryExtension = async ({
  rawQuery: string;
  extensionQueries: string[];
  model: string;
-  tokens: number;
+  inputTokens: number;
+  outputTokens: number;
 }> => {
  const systemFewShot = chatBg
    ? `Q: 对话背景。
@@ -166,7 +167,8 @@ A: ${chatBg}
      rawQuery: query,
      extensionQueries: [],
      model,
-      tokens: 0
+      inputTokens: 0,
+      outputTokens: 0
    };
  }

@@ -181,7 +183,8 @@ A: ${chatBg}
      rawQuery: query,
      extensionQueries: Array.isArray(queries) ? queries : [],
      model,
-      tokens: await countGptMessagesTokens(messages)
+      inputTokens: await countGptMessagesTokens(messages),
+      outputTokens: await countPromptTokens(answer)
    };
  } catch (error) {
    addLog.error(`Query extension error`, error);
@@ -189,7 +192,8 @@ A: ${chatBg}
      rawQuery: query,
      extensionQueries: [],
      model,
-      tokens: 0
+      inputTokens: 0,
+      outputTokens: 0
    };
  }
 };