feat: chat content use tiktoken count

2025-07-23 05:12:39 +00:00 · 2023-04-24 16:46:39 +08:00
parent adbaa8b37b
commit 1f112f7715
23 changed files with 182 additions and 836 deletions
--- a/package.json
+++ b/package.json
@@ -29,7 +29,6 @@
    "eventsource-parser": "^0.1.0",
    "formidable": "^2.1.1",
    "framer-motion": "^9.0.6",
    "gpt-token-utils": "^1.2.0",
    "graphemer": "^1.4.0",
    "hyperdown": "^2.4.29",
    "immer": "^9.0.19",
--- a/pnpm-lock.yaml
+++ b/pnpm-lock.yaml
@@ -33,7 +33,6 @@ specifiers:
  eventsource-parser: ^0.1.0
  formidable: ^2.1.1
  framer-motion: ^9.0.6
  gpt-token-utils: ^1.2.0
  graphemer: ^1.4.0
  husky: ^8.0.3
  hyperdown: ^2.4.29
@@ -86,7 +85,6 @@ dependencies:
  eventsource-parser: registry.npmmirror.com/eventsource-parser/0.1.0
  formidable: registry.npmmirror.com/formidable/2.1.1
  framer-motion: registry.npmmirror.com/framer-motion/9.0.6_biqbaboplfbrettd7655fr4n2y
  gpt-token-utils: registry.npmmirror.com/gpt-token-utils/1.2.0
  graphemer: registry.npmmirror.com/graphemer/1.4.0
  hyperdown: registry.npmmirror.com/hyperdown/2.4.29
  immer: registry.npmmirror.com/immer/9.0.19
@@ -7668,12 +7666,6 @@ packages:
      get-intrinsic: registry.npmmirror.com/get-intrinsic/1.2.0
    dev: true
  registry.npmmirror.com/gpt-token-utils/1.2.0:
    resolution: {integrity: sha512-s8twaU38UE2Vp65JhQEjz8qvWhWY8KZYvmvYHapxlPT03Ok35Clq+gm9eE27wQILdFisseMVRSiC5lJR9GBklA==, registry: https://registry.npm.taobao.org/, tarball: https://registry.npmmirror.com/gpt-token-utils/-/gpt-token-utils-1.2.0.tgz}
    name: gpt-token-utils
    version: 1.2.0
    dev: false
  registry.npmmirror.com/graceful-fs/4.2.10:
    resolution: {integrity: sha512-9ByhssR2fPVsNZj478qUUbKfmL0+t5BDVyjShtyZZLiK7ZDAArFFfopyOTj0M05wE2tJPisA4iTnnXl2YoPvOA==, registry: https://registry.npm.taobao.org/, tarball: https://registry.npmmirror.com/graceful-fs/-/graceful-fs-4.2.10.tgz}
    name: graceful-fs
--- a/src/constants/model.ts
+++ b/src/constants/model.ts
@@ -5,24 +5,28 @@ export enum ModelDataStatusEnum {
  waiting = 'waiting'
 }
-export enum ChatModelNameEnum {
+export const embeddingModel = 'text-embedding-ada-002';
-  GPT35 = 'gpt-3.5-turbo',
+export enum ChatModelEnum {
-  VECTOR_GPT = 'VECTOR_GPT',
+  'GPT35' = 'gpt-3.5-turbo',
-  VECTOR = 'text-embedding-ada-002'
+  'GPT4' = 'gpt-4',
  'GPT432k' = 'gpt-4-32k'
 }
-export const ChatModelNameMap = {
+export enum ModelNameEnum {
-  [ChatModelNameEnum.GPT35]: 'gpt-3.5-turbo',
+  GPT35 = 'gpt-3.5-turbo',
-  [ChatModelNameEnum.VECTOR_GPT]: 'gpt-3.5-turbo',
+  VECTOR_GPT = 'VECTOR_GPT'
-  [ChatModelNameEnum.VECTOR]: 'text-embedding-ada-002'
+}
 export const Model2ChatModelMap: Record<`${ModelNameEnum}`, `${ChatModelEnum}`> = {
  [ModelNameEnum.GPT35]: 'gpt-3.5-turbo',
  [ModelNameEnum.VECTOR_GPT]: 'gpt-3.5-turbo'
 };
 export type ModelConstantsData = {
  icon: 'model' | 'dbModel';
  name: string;
-  model: `${ChatModelNameEnum}`;
+  model: `${ModelNameEnum}`;
  trainName: string; // 空字符串代表不能训练
  maxToken: number;
  contextMaxToken: number;
  maxTemperature: number;
  price: number; // 多少钱 / 1token，单位: 0.00001元
@@ -32,20 +36,18 @@ export const modelList: ModelConstantsData[] = [
  {
    icon: 'model',
    name: 'chatGPT',
-    model: ChatModelNameEnum.GPT35,
+    model: ModelNameEnum.GPT35,
    trainName: '',
-    maxToken: 4000,
+    contextMaxToken: 4096,
    contextMaxToken: 7000,
    maxTemperature: 1.5,
    price: 3
  },
  {
    icon: 'dbModel',
    name: '知识库',
-    model: ChatModelNameEnum.VECTOR_GPT,
+    model: ModelNameEnum.VECTOR_GPT,
    trainName: 'vector',
-    maxToken: 4000,
+    contextMaxToken: 4096,
    contextMaxToken: 7000,
    maxTemperature: 1,
    price: 3
  }
@@ -133,8 +135,8 @@ export const defaultModel: ModelSchema = {
  },
  service: {
    trainId: '',
-    chatModel: ChatModelNameEnum.GPT35,
+    chatModel: ModelNameEnum.GPT35,
-    modelName: ChatModelNameEnum.GPT35
+    modelName: ModelNameEnum.GPT35
  },
  security: {
    domain: ['*'],
--- a/src/pages/api/chat/chatGpt.ts
+++ b/src/pages/api/chat/chatGpt.ts
@@ -2,7 +2,6 @@ import type { NextApiRequest, NextApiResponse } from 'next';
 import { connectToDatabase } from '@/service/mongo';
 import { getOpenAIApi, authChat } from '@/service/utils/auth';
 import { httpsAgent, openaiChatFilter } from '@/service/utils/tools';
 import { ChatCompletionRequestMessage, ChatCompletionRequestMessageRoleEnum } from 'openai';
 import { ChatItemType } from '@/types/chat';
 import { jsonRes } from '@/service/response';
 import { PassThrough } from 'stream';
@@ -64,42 +63,23 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    }
    // 控制在 tokens 数量，防止超出
-    const filterPrompts = openaiChatFilter(prompts, modelConstantsData.contextMaxToken);
+    const filterPrompts = openaiChatFilter({
-
+      model: model.service.chatModel,
-    // 格式化文本内容成 chatgpt 格式
+      prompts,
-    const map = {
+      maxTokens: modelConstantsData.contextMaxToken - 500
-      Human: ChatCompletionRequestMessageRoleEnum.User,
+    });
      AI: ChatCompletionRequestMessageRoleEnum.Assistant,
      SYSTEM: ChatCompletionRequestMessageRoleEnum.System
    };
    const formatPrompts: ChatCompletionRequestMessage[] = filterPrompts.map(
      (item: ChatItemType) => ({
        role: map[item.obj],
        content: item.value
      })
    );
    // 计算温度
    const temperature = modelConstantsData.maxTemperature * (model.temperature / 10);
-    // console.log({
+    // console.log(filterPrompts);
    //   model: model.service.chatModel,
    //   temperature: temperature,
    //   // max_tokens: modelConstantsData.maxToken,
    //   messages: formatPrompts,
    //   frequency_penalty: 0.5, // 越大，重复内容越少
    //   presence_penalty: -0.5, // 越大，越容易出现新内容
    //   stream: true,
    //   stop: ['.!?。']
    // });
    // 获取 chatAPI
    const chatAPI = getOpenAIApi(userApiKey || systemKey);
    // 发出请求
    const chatResponse = await chatAPI.createChatCompletion(
      {
        model: model.service.chatModel,
-        temperature: temperature,
+        temperature,
-        // max_tokens: modelConstantsData.maxToken,
+        messages: filterPrompts,
        messages: formatPrompts,
        frequency_penalty: 0.5, // 越大，重复内容越少
        presence_penalty: -0.5, // 越大，越容易出现新内容
        stream: true,
@@ -121,7 +101,6 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
      stream,
      chatResponse
    });
    const promptsContent = formatPrompts.map((item) => item.content).join('');
    // 只有使用平台的 key 才计费
    pushChatBill({
@@ -129,7 +108,7 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
      modelName: model.service.modelName,
      userId,
      chatId,
-      text: promptsContent + responseContent
+      messages: filterPrompts.concat({ role: 'assistant', content: responseContent })
    });
  } catch (err: any) {
    if (step === 1) {
--- a/src/pages/api/chat/vectorGpt.ts
+++ b/src/pages/api/chat/vectorGpt.ts
@@ -2,10 +2,8 @@ import type { NextApiRequest, NextApiResponse } from 'next';
 import { connectToDatabase } from '@/service/mongo';
 import { authChat } from '@/service/utils/auth';
 import { httpsAgent, systemPromptFilter, openaiChatFilter } from '@/service/utils/tools';
 import { ChatCompletionRequestMessage, ChatCompletionRequestMessageRoleEnum } from 'openai';
 import { ChatItemType } from '@/types/chat';
 import { jsonRes } from '@/service/response';
 import type { ModelSchema } from '@/types/mongoSchema';
 import { PassThrough } from 'stream';
 import {
  modelList,
@@ -105,9 +103,13 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
        value: model.systemPrompt
      });
    } else {
-      // 有匹配情况下，添加知识库内容。
+      // 有匹配情况下，system 添加知识库内容。
-      // 系统提示词过滤，最多 3000 tokens
+      // 系统提示词过滤，最多 2500 tokens
-      const systemPrompt = systemPromptFilter(formatRedisPrompt, 3000);
+      const systemPrompt = systemPromptFilter({
        model: model.service.chatModel,
        prompts: formatRedisPrompt,
        maxTokens: 2500
      });
      prompts.unshift({
        obj: 'SYSTEM',
@@ -124,21 +126,13 @@ ${
    }
    // 控制在 tokens 数量，防止超出
-    const filterPrompts = openaiChatFilter(prompts, modelConstantsData.contextMaxToken);
+    const filterPrompts = openaiChatFilter({
      model: model.service.chatModel,
      prompts,
      maxTokens: modelConstantsData.contextMaxToken - 500
    });
-    // 格式化文本内容成 chatgpt 格式
+    // console.log(filterPrompts);
    const map = {
      Human: ChatCompletionRequestMessageRoleEnum.User,
      AI: ChatCompletionRequestMessageRoleEnum.Assistant,
      SYSTEM: ChatCompletionRequestMessageRoleEnum.System
    };
    const formatPrompts: ChatCompletionRequestMessage[] = filterPrompts.map(
      (item: ChatItemType) => ({
        role: map[item.obj],
        content: item.value
      })
    );
    // console.log(formatPrompts);
    // 计算温度
    const temperature = modelConstantsData.maxTemperature * (model.temperature / 10);
@@ -146,9 +140,8 @@ ${
    const chatResponse = await chatAPI.createChatCompletion(
      {
        model: model.service.chatModel,
-        temperature: temperature,
+        temperature,
-        // max_tokens: modelConstantsData.maxToken,
+        messages: filterPrompts,
        messages: formatPrompts,
        frequency_penalty: 0.5, // 越大，重复内容越少
        presence_penalty: -0.5, // 越大，越容易出现新内容
        stream: true
@@ -170,14 +163,13 @@ ${
      chatResponse
    });
    const promptsContent = formatPrompts.map((item) => item.content).join('');
    // 只有使用平台的 key 才计费
    pushChatBill({
      isPay: !userApiKey,
      modelName: model.service.modelName,
      userId,
      chatId,
-      text: promptsContent + responseContent
+      messages: filterPrompts.concat({ role: 'assistant', content: responseContent })
    });
    // jsonRes(res);
  } catch (err: any) {
--- a/src/pages/api/data/splitData.ts
+++ b/src/pages/api/data/splitData.ts
@@ -4,7 +4,7 @@ import { connectToDatabase, DataItem, Data } from '@/service/mongo';
 import { authToken } from '@/service/utils/tools';
 import { generateQA } from '@/service/events/generateQA';
 import { generateAbstract } from '@/service/events/generateAbstract';
-import { encode } from 'gpt-token-utils';
+import { countChatTokens } from '@/utils/tools';
 /* 拆分数据成QA */
 export default async function handler(req: NextApiRequest, res: NextApiResponse) {
@@ -34,7 +34,7 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    chunks.forEach((chunk) => {
      splitText += chunk;
-      const tokens = encode(splitText).length;
+      const tokens = countChatTokens({ messages: [{ role: 'system', content: splitText }] });
      if (tokens >= 780) {
        dataItems.push({
          userId,
--- a/src/pages/api/model/create.ts
+++ b/src/pages/api/model/create.ts
@@ -3,14 +3,14 @@ import type { NextApiRequest, NextApiResponse } from 'next';
 import { jsonRes } from '@/service/response';
 import { connectToDatabase } from '@/service/mongo';
 import { authToken } from '@/service/utils/tools';
-import { ModelStatusEnum, modelList, ChatModelNameEnum, ChatModelNameMap } from '@/constants/model';
+import { ModelStatusEnum, modelList, ModelNameEnum, Model2ChatModelMap } from '@/constants/model';
 import { Model } from '@/service/models/model';
 export default async function handler(req: NextApiRequest, res: NextApiResponse<any>) {
  try {
    const { name, serviceModelName } = req.body as {
      name: string;
-      serviceModelName: `${ChatModelNameEnum}`;
+      serviceModelName: `${ModelNameEnum}`;
    };
    const { authorization } = req.headers;
@@ -48,7 +48,7 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse<
      status: ModelStatusEnum.running,
      service: {
        trainId: '',
-        chatModel: ChatModelNameMap[modelItem.model], // 聊天时用的模型
+        chatModel: Model2ChatModelMap[modelItem.model], // 聊天时用的模型
        modelName: modelItem.model // 最底层的模型，不会变，用于计费等核心操作
      }
    });
--- a/src/pages/api/openapi/chat/chatGpt.ts
+++ b/src/pages/api/openapi/chat/chatGpt.ts
@@ -75,21 +75,13 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    }
    // 控制在 tokens 数量，防止超出
-    const filterPrompts = openaiChatFilter(prompts, modelConstantsData.contextMaxToken);
+    const filterPrompts = openaiChatFilter({
      model: model.service.chatModel,
      prompts,
      maxTokens: modelConstantsData.contextMaxToken - 500
    });
-    // 格式化文本内容成 chatgpt 格式
+    // console.log(filterPrompts);
    const map = {
      Human: ChatCompletionRequestMessageRoleEnum.User,
      AI: ChatCompletionRequestMessageRoleEnum.Assistant,
      SYSTEM: ChatCompletionRequestMessageRoleEnum.System
    };
    const formatPrompts: ChatCompletionRequestMessage[] = filterPrompts.map(
      (item: ChatItemType) => ({
        role: map[item.obj],
        content: item.value
      })
    );
    // console.log(formatPrompts);
    // 计算温度
    const temperature = modelConstantsData.maxTemperature * (model.temperature / 10);
@@ -99,9 +91,8 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    const chatResponse = await chatAPI.createChatCompletion(
      {
        model: model.service.chatModel,
-        temperature: temperature,
+        temperature,
-        // max_tokens: modelConstantsData.maxToken,
+        messages: filterPrompts,
        messages: formatPrompts,
        frequency_penalty: 0.5, // 越大，重复内容越少
        presence_penalty: -0.5, // 越大，越容易出现新内容
        stream: isStream,
@@ -133,14 +124,12 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
      });
    }
    const promptsContent = formatPrompts.map((item) => item.content).join('');
    // 只有使用平台的 key 才计费
    pushChatBill({
      isPay: true,
      modelName: model.service.modelName,
      userId,
-      text: promptsContent + responseContent
+      messages: filterPrompts.concat({ role: 'assistant', content: responseContent })
    });
  } catch (err: any) {
    if (step === 1) {
--- a/src/pages/api/openapi/chat/lafGpt.ts
+++ b/src/pages/api/openapi/chat/lafGpt.ts
@@ -3,15 +3,14 @@ import { connectToDatabase, Model } from '@/service/mongo';
 import { getOpenAIApi } from '@/service/utils/auth';
 import { authOpenApiKey } from '@/service/utils/tools';
 import { httpsAgent, openaiChatFilter, systemPromptFilter } from '@/service/utils/tools';
 import { ChatCompletionRequestMessage, ChatCompletionRequestMessageRoleEnum } from 'openai';
 import { ChatItemType } from '@/types/chat';
 import { jsonRes } from '@/service/response';
 import { PassThrough } from 'stream';
 import {
-  ChatModelNameEnum,
+  ModelNameEnum,
  modelList,
-  ChatModelNameMap,
+  ModelVectorSearchModeMap,
-  ModelVectorSearchModeMap
+  ChatModelEnum
 } from '@/constants/model';
 import { pushChatBill } from '@/service/events/pushBill';
 import { openaiCreateEmbedding, gpt35StreamResponse } from '@/service/utils/openai';
@@ -60,9 +59,7 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
      throw new Error('找不到模型');
    }
-    const modelConstantsData = modelList.find(
+    const modelConstantsData = modelList.find((item) => item.model === ModelNameEnum.VECTOR_GPT);
      (item) => item.model === ChatModelNameEnum.VECTOR_GPT
    );
    if (!modelConstantsData) {
      throw new Error('模型已下架');
    }
@@ -74,7 +71,7 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    // 请求一次 chatgpt 拆解需求
    const promptResponse = await chatAPI.createChatCompletion(
      {
-        model: ChatModelNameMap[ChatModelNameEnum.GPT35],
+        model: ChatModelEnum.GPT35,
        temperature: 0,
        frequency_penalty: 0.5, // 越大，重复内容越少
        presence_penalty: -0.5, // 越大，越容易出现新内容
@@ -122,7 +119,7 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
        ]
      },
      {
-        timeout: 120000,
+        timeout: 180000,
        httpsAgent: httpsAgent(true)
      }
    );
@@ -163,30 +160,26 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    const formatRedisPrompt: string[] = vectorSearch.rows.map((item) => `${item.q}\n${item.a}`);
-    // textArr 筛选，最多 2500 tokens
+    // system 筛选，最多 2500 tokens
-    const systemPrompt = systemPromptFilter(formatRedisPrompt, 2500);
+    const systemPrompt = systemPromptFilter({
      model: model.service.chatModel,
      prompts: formatRedisPrompt,
      maxTokens: 2500
    });
    prompts.unshift({
      obj: 'SYSTEM',
      value: `${model.systemPrompt} 知识库是最新的,下面是知识库内容:${systemPrompt}`
    });
-    // 控制在 tokens 数量，防止超出
+    // 控制上下文 tokens 数量，防止超出
-    const filterPrompts = openaiChatFilter(prompts, modelConstantsData.contextMaxToken);
+    const filterPrompts = openaiChatFilter({
      model: model.service.chatModel,
      prompts,
      maxTokens: modelConstantsData.contextMaxToken - 500
    });
-    // 格式化文本内容成 chatgpt 格式
+    // console.log(filterPrompts);
    const map = {
      Human: ChatCompletionRequestMessageRoleEnum.User,
      AI: ChatCompletionRequestMessageRoleEnum.Assistant,
      SYSTEM: ChatCompletionRequestMessageRoleEnum.System
    };
    const formatPrompts: ChatCompletionRequestMessage[] = filterPrompts.map(
      (item: ChatItemType) => ({
        role: map[item.obj],
        content: item.value
      })
    );
    // console.log(formatPrompts);
    // 计算温度
    const temperature = modelConstantsData.maxTemperature * (model.temperature / 10);
@@ -195,13 +188,13 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
      {
        model: model.service.chatModel,
        temperature,
-        messages: formatPrompts,
+        messages: filterPrompts,
        frequency_penalty: 0.5, // 越大，重复内容越少
        presence_penalty: -0.5, // 越大，越容易出现新内容
        stream: isStream
      },
      {
-        timeout: 120000,
+        timeout: 180000,
        responseType: isStream ? 'stream' : 'json',
        httpsAgent: httpsAgent(true)
      }
@@ -228,13 +221,11 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
    console.log('laf gpt done. time:', `${(Date.now() - startTime) / 1000}s`);
    const promptsContent = formatPrompts.map((item) => item.content).join('');
    pushChatBill({
      isPay: true,
      modelName: model.service.modelName,
      userId,
-      text: promptsContent + responseContent
+      messages: filterPrompts.concat({ role: 'assistant', content: responseContent })
    });
  } catch (err: any) {
    if (step === 1) {
--- a/src/pages/api/openapi/chat/vectorGpt.ts
+++ b/src/pages/api/openapi/chat/vectorGpt.ts
@@ -126,8 +126,12 @@ export default async function handler(req: NextApiRequest, res: NextApiResponse)
      });
    } else {
      // 有匹配或者低匹配度模式情况下，添加知识库内容。
-      // 系统提示词过滤，最多 3000 tokens
+      // 系统提示词过滤，最多 2500 tokens
-      const systemPrompt = systemPromptFilter(formatRedisPrompt, 3000);
+      const systemPrompt = systemPromptFilter({
        model: model.service.chatModel,
        prompts: formatRedisPrompt,
        maxTokens: 2500
      });
      prompts.unshift({
        obj: 'SYSTEM',
@@ -144,21 +148,13 @@ ${
    }
    // 控制在 tokens 数量，防止超出
-    const filterPrompts = openaiChatFilter(prompts, modelConstantsData.contextMaxToken);
+    const filterPrompts = openaiChatFilter({
      model: model.service.chatModel,
      prompts,
      maxTokens: modelConstantsData.contextMaxToken - 500
    });
-    // 格式化文本内容成 chatgpt 格式
+    // console.log(filterPrompts);
    const map = {
      Human: ChatCompletionRequestMessageRoleEnum.User,
      AI: ChatCompletionRequestMessageRoleEnum.Assistant,
      SYSTEM: ChatCompletionRequestMessageRoleEnum.System
    };
    const formatPrompts: ChatCompletionRequestMessage[] = filterPrompts.map(
      (item: ChatItemType) => ({
        role: map[item.obj],
        content: item.value
      })
    );
    // console.log(formatPrompts);
    // 计算温度
    const temperature = modelConstantsData.maxTemperature * (model.temperature / 10);
@@ -166,14 +162,14 @@ ${
    const chatResponse = await chatAPI.createChatCompletion(
      {
        model: model.service.chatModel,
-        temperature: temperature,
+        temperature,
-        messages: formatPrompts,
+        messages: filterPrompts,
        frequency_penalty: 0.5, // 越大，重复内容越少
        presence_penalty: -0.5, // 越大，越容易出现新内容
        stream: isStream
      },
      {
-        timeout: 120000,
+        timeout: 180000,
        responseType: isStream ? 'stream' : 'json',
        httpsAgent: httpsAgent(true)
      }
@@ -198,12 +194,11 @@ ${
      });
    }
    const promptsContent = formatPrompts.map((item) => item.content).join('');
    pushChatBill({
      isPay: true,
      modelName: model.service.modelName,
      userId,
-      text: promptsContent + responseContent
+      messages: filterPrompts.concat({ role: 'assistant', content: responseContent })
    });
    // jsonRes(res);
  } catch (err: any) {
--- a/src/pages/chat/index.tsx
+++ b/src/pages/chat/index.tsx
@@ -21,7 +21,7 @@ import {
 import { useToast } from '@/hooks/useToast';
 import { useScreen } from '@/hooks/useScreen';
 import { useQuery } from '@tanstack/react-query';
-import { ChatModelNameEnum } from '@/constants/model';
+import { ModelNameEnum } from '@/constants/model';
 import dynamic from 'next/dynamic';
 import { useGlobalStore } from '@/store/global';
 import { useCopyData } from '@/utils/tools';
@@ -178,8 +178,8 @@ const Chat = ({ modelId, chatId }: { modelId: string; chatId: string }) => {
  const gptChatPrompt = useCallback(
    async (prompts: ChatSiteItemType) => {
      const urlMap: Record<string, string> = {
-        [ChatModelNameEnum.GPT35]: '/api/chat/chatGpt',
+        [ModelNameEnum.GPT35]: '/api/chat/chatGpt',
-        [ChatModelNameEnum.VECTOR_GPT]: '/api/chat/vectorGpt'
+        [ModelNameEnum.VECTOR_GPT]: '/api/chat/vectorGpt'
      };
      if (!urlMap[chatData.modelName]) return Promise.reject('找不到模型');
--- a/src/pages/data/components/CreateDataModal.tsx
+++ b/src/pages/data/components/CreateDataModal.tsx
@@ -1,97 +0,0 @@
 import React, { useState } from 'react';
 import {
  Modal,
  ModalOverlay,
  ModalContent,
  ModalHeader,
  ModalFooter,
  ModalBody,
  ModalCloseButton,
  Button,
  Input,
  Select,
  FormControl,
  FormErrorMessage
 } from '@chakra-ui/react';
 import { postData } from '@/api/data';
 import { useMutation } from '@tanstack/react-query';
 import { useForm, SubmitHandler } from 'react-hook-form';
 import { DataType } from '@/types/data';
 import { DataTypeTextMap } from '@/constants/data';
 export interface CreateDataProps {
  name: string;
  type: DataType;
 }
 const CreateDataModal = ({
  onClose,
  onSuccess
 }: {
  onClose: () => void;
  onSuccess: () => void;
 }) => {
  const [inputVal, setInputVal] = useState('');
  const {
    getValues,
    register,
    handleSubmit,
    formState: { errors }
  } = useForm<CreateDataProps>({
    defaultValues: {
      name: '',
      type: 'abstract'
    }
  });
  const { isLoading, mutate } = useMutation({
    mutationFn: (e: CreateDataProps) => postData(e),
    onSuccess() {
      onSuccess();
      onClose();
    }
  });
  return (
    <Modal isOpen={true} onClose={onClose}>
      <ModalOverlay />
      <ModalContent>
        <ModalHeader>创建数据集</ModalHeader>
        <ModalCloseButton />
        <ModalBody>
          <FormControl mb={8} isInvalid={!!errors.name}>
            <Input
              placeholder="数据集名称"
              {...register('name', {
                required: '数据集名称不能为空'
              })}
            />
            <FormErrorMessage position={'absolute'} fontSize="xs">
              {!!errors.name && errors.name.message}
            </FormErrorMessage>
          </FormControl>
          <FormControl>
            <Select placeholder="数据集类型" {...register('type', {})}>
              {Object.entries(DataTypeTextMap).map(([key, value]) => (
                <option key={key} value={key}>
                  {value}
                </option>
              ))}
            </Select>
          </FormControl>
        </ModalBody>
        <ModalFooter>
          <Button colorScheme={'gray'} onClick={onClose}>
            取消
          </Button>
          <Button ml={3} isLoading={isLoading} onClick={handleSubmit(mutate as any)}>
            确认
          </Button>
        </ModalFooter>
      </ModalContent>
    </Modal>
  );
 };
 export default CreateDataModal;
--- a/src/pages/data/components/ImportDataModal.tsx
+++ b/src/pages/data/components/ImportDataModal.tsx
@@ -1,229 +0,0 @@
 import React, { useState, useCallback } from 'react';
 import {
  Modal,
  ModalOverlay,
  ModalContent,
  ModalHeader,
  ModalFooter,
  ModalBody,
  ModalCloseButton,
  Button,
  Box,
  Flex,
  Textarea
 } from '@chakra-ui/react';
 import { useTabs } from '@/hooks/useTabs';
 import { useConfirm } from '@/hooks/useConfirm';
 import { useSelectFile } from '@/hooks/useSelectFile';
 import { readTxtContent, readPdfContent, readDocContent } from '@/utils/file';
 import { postSplitData } from '@/api/data';
 import { useMutation } from '@tanstack/react-query';
 import { useToast } from '@/hooks/useToast';
 import { useLoading } from '@/hooks/useLoading';
 import { formatPrice } from '@/utils/user';
 import { modelList, ChatModelNameEnum } from '@/constants/model';
 import { encode } from 'gpt-token-utils';
 const fileExtension = '.txt,.doc,.docx,.pdf,.md';
 const ImportDataModal = ({
  dataId,
  onClose,
  onSuccess
 }: {
  dataId: string;
  onClose: () => void;
  onSuccess: () => void;
 }) => {
  const { openConfirm, ConfirmChild } = useConfirm({
    content: '确认提交生成任务？该任务无法终止！'
  });
  const { toast } = useToast();
  const { setIsLoading, Loading } = useLoading();
  const { File, onOpen } = useSelectFile({ fileType: fileExtension, multiple: true });
  const { tabs, activeTab, setActiveTab } = useTabs({
    tabs: [
      { id: 'text', label: '文本' },
      { id: 'doc', label: '文件' }
      // { id: 'url', label: '链接' }
    ]
  });
  const [textInput, setTextInput] = useState('');
  const [fileText, setFileText] = useState('');
  const { mutate: handleClickSubmit, isLoading } = useMutation({
    mutationFn: async () => {
      let text = '';
      if (activeTab === 'text') {
        text = textInput;
      } else if (activeTab === 'doc') {
        text = fileText;
      } else if (activeTab === 'url') {
      }
      if (!text) return;
      return postSplitData(dataId, text);
    },
    onSuccess() {
      toast({
        title: '任务提交成功',
        status: 'success'
      });
      onClose();
      onSuccess();
    },
    onError(err: any) {
      toast({
        title: err?.message || '提交任务异常',
        status: 'error'
      });
    }
  });
  const onSelectFile = useCallback(
    async (e: File[]) => {
      setIsLoading(true);
      try {
        const fileTexts = (
          await Promise.all(
            e.map((file) => {
              // @ts-ignore
              const extension = file?.name?.split('.').pop().toLowerCase();
              switch (extension) {
                case 'txt':
                case 'md':
                  return readTxtContent(file);
                case 'pdf':
                  return readPdfContent(file);
                case 'doc':
                case 'docx':
                  return readDocContent(file);
                default:
                  return '';
              }
            })
          )
        )
          .join('\n')
          .replace(/\n+/g, '\n');
        setFileText(fileTexts);
        console.log(encode(fileTexts));
      } catch (error: any) {
        console.log(error);
        toast({
          title: typeof error === 'string' ? error : '解析文件失败',
          status: 'error'
        });
      }
      setIsLoading(false);
    },
    [setIsLoading, toast]
  );
  return (
    <Modal isOpen={true} onClose={onClose}>
      <ModalOverlay />
      <ModalContent position={'relative'} maxW={['90vw', '800px']}>
        <ModalHeader>
          导入数据，生成QA
          <Box ml={2} as={'span'} fontSize={'sm'} color={'blackAlpha.600'}>
            {formatPrice(
              modelList.find((item) => item.model === ChatModelNameEnum.GPT35)?.price || 0,
              1000
            )}
            元/1K tokens
          </Box>
        </ModalHeader>
        <ModalCloseButton />
        <ModalBody display={'flex'}>
          <Box>
            {tabs.map((item) => (
              <Button
                key={item.id}
                display={'block'}
                variant={activeTab === item.id ? 'solid' : 'outline'}
                _notLast={{
                  mb: 3
                }}
                onClick={() => setActiveTab(item.id)}
              >
                {item.label}
              </Button>
            ))}
          </Box>
          <Box flex={'1 0 0'} w={0} ml={3} minH={'200px'}>
            {activeTab === 'text' && (
              <>
                <Textarea
                  h={'100%'}
                  maxLength={-1}
                  value={textInput}
                  placeholder={'请粘贴或输入需要处理的文本'}
                  onChange={(e) => setTextInput(e.target.value)}
                />
                <Box mt={2}>
                  一共 {textInput.length} 个字，{encode(textInput).length} 个tokens
                </Box>
              </>
            )}
            {activeTab === 'doc' && (
              <Flex
                flexDirection={'column'}
                p={2}
                h={'100%'}
                alignItems={'center'}
                justifyContent={'center'}
                border={'1px solid '}
                borderColor={'blackAlpha.200'}
                borderRadius={'md'}
                fontSize={'sm'}
              >
                <Button onClick={onOpen}>选择文件</Button>
                <Box mt={2}>支持 {fileExtension} 文件</Box>
                {fileText && (
                  <>
                    <Box mt={2}>
                      一共 {fileText.length} 个字，{encode(fileText).length} 个tokens
                    </Box>
                    <Box
                      maxH={'300px'}
                      w={'100%'}
                      overflow={'auto'}
                      p={2}
                      backgroundColor={'blackAlpha.50'}
                      whiteSpace={'pre'}
                      fontSize={'xs'}
                    >
                      {fileText}
                    </Box>
                  </>
                )}
              </Flex>
            )}
          </Box>
        </ModalBody>
        <ModalFooter>
          <Button colorScheme={'gray'} onClick={onClose}>
            取消
          </Button>
          <Button
            ml={3}
            isLoading={isLoading}
            isDisabled={!textInput && !fileText}
            onClick={openConfirm(handleClickSubmit)}
          >
            确认
          </Button>
        </ModalFooter>
        <Loading />
      </ModalContent>
      <ConfirmChild />
      <File onSelect={onSelectFile} />
    </Modal>
  );
 };
 export default ImportDataModal;
--- a/src/pages/data/detail.tsx
+++ b/src/pages/data/detail.tsx
@@ -1,67 +0,0 @@
 import React from 'react';
 import { Box, Card } from '@chakra-ui/react';
 import ScrollData from '@/components/ScrollData';
 import { getDataItems } from '@/api/data';
 import { usePaging } from '@/hooks/usePaging';
 import type { DataItemSchema } from '@/types/mongoSchema';
 const DataDetail = ({ dataName, dataId }: { dataName: string; dataId: string }) => {
  const {
    nextPage,
    isLoadAll,
    requesting,
    data: dataItems
  } = usePaging<DataItemSchema>({
    api: getDataItems,
    pageSize: 10,
    params: {
      dataId
    }
  });
  return (
    <Card py={4} h={'100%'} display={'flex'} flexDirection={'column'}>
      <Box px={6} fontSize={'xl'} fontWeight={'bold'}>
        {dataName} 结果
      </Box>
      <ScrollData
        flex={'1 0 0'}
        h={0}
        px={6}
        mt={3}
        isLoadAll={isLoadAll}
        requesting={requesting}
        nextPage={nextPage}
        fontSize={'xs'}
        whiteSpace={'pre-wrap'}
      >
        {dataItems.map((item) => (
          <Box key={item._id}>
            {item.result.map((result, i) => (
              <Box key={i} mb={3}>
                {item.type === 'QA' && (
                  <>
                    <Box fontWeight={'bold'}>Q: {result.q}</Box>
                    <Box>A: {result.a}</Box>
                  </>
                )}
                {item.type === 'abstract' && <Box fontSize={'sm'}>{result.abstract}</Box>}
              </Box>
            ))}
          </Box>
        ))}
      </ScrollData>
    </Card>
  );
 };
 export default DataDetail;
 export async function getServerSideProps(context: any) {
  return {
    props: {
      dataName: context.query?.dataName || '',
      dataId: context.query?.dataId || ''
    }
  };
 }
--- a/src/pages/data/list.tsx
+++ b/src/pages/data/list.tsx
@@ -1,235 +0,0 @@
 import React, { useState, useCallback } from 'react';
 import {
  Card,
  Box,
  Flex,
  Button,
  Table,
  Thead,
  Tbody,
  Tr,
  Th,
  Td,
  TableContainer,
  useDisclosure,
  Input,
  Menu,
  MenuButton,
  MenuList,
  MenuItem
 } from '@chakra-ui/react';
 import { getDataList, updateDataName, delData, getDataItems } from '@/api/data';
 import type { DataListItem } from '@/types/data';
 import dayjs from 'dayjs';
 import dynamic from 'next/dynamic';
 import { useRouter } from 'next/router';
 import { useConfirm } from '@/hooks/useConfirm';
 import { useRequest } from '@/hooks/useRequest';
 import { DataItemSchema } from '@/types/mongoSchema';
 import { DataTypeTextMap } from '@/constants/data';
 import { customAlphabet } from 'nanoid';
 import { useQuery } from '@tanstack/react-query';
 const nanoid = customAlphabet('.,', 1);
 const CreateDataModal = dynamic(() => import('./components/CreateDataModal'));
 const ImportDataModal = dynamic(() => import('./components/ImportDataModal'));
 export type ExportDataType = 'jsonl' | 'txt';
 const DataList = () => {
  const router = useRouter();
  const [ImportDataId, setImportDataId] = useState<string>();
  const { openConfirm, ConfirmChild } = useConfirm({
    content: '删除数据集，将删除里面的所有内容，请确认！'
  });
  const {
    isOpen: isOpenCreateDataModal,
    onOpen: onOpenCreateDataModal,
    onClose: onCloseCreateDataModal
  } = useDisclosure();
  const { data: dataList = [], refetch } = useQuery(['getDataList'], getDataList, {
    refetchInterval: 10000
  });
  const { mutate: handleDelData, isLoading: isDeleting } = useRequest({
    mutationFn: (dataId: string) => delData(dataId),
    successToast: '删除数据集成功',
    errorToast: '删除数据集异常',
    onSuccess() {
      refetch();
    }
  });
  const { mutate: handleExportData, isLoading: isExporting } = useRequest({
    mutationFn: async ({ data, type }: { data: DataListItem; type: ExportDataType }) => ({
      type,
      data: await getDataItems({ dataId: data._id, pageNum: 1, pageSize: data.totalData }).then(
        (res) => res.data
      )
    }),
    successToast: '导出数据集成功',
    errorToast: '导出数据集异常',
    onSuccess(res: { type: ExportDataType; data: DataItemSchema[] }) {
      // 合并数据
      const data = res.data.map((item) => item.result).flat();
      let text = '';
      // 生成 jsonl
      data.forEach((item) => {
        if (res.type === 'jsonl' && item.q && item.a) {
          const result = JSON.stringify({
            prompt: `${item.q.toLocaleLowerCase()}${nanoid()}</s>`,
            completion: ` ${item.a}###`
          });
          text += `${result}\n`;
        } else if (res.type === 'txt' && item.abstract) {
          text += `${item.abstract}\n`;
        }
      });
      // 去掉最后一个 \n
      text = text.substring(0, text.length - 1);
      // 导出为文件
      const blob = new Blob([text], { type: 'application/json;charset=utf-8' });
      // 创建下载链接
      const downloadLink = document.createElement('a');
      downloadLink.href = window.URL.createObjectURL(blob);
      downloadLink.download = `data.${res.type}`;
      // 添加链接到页面并触发下载
      document.body.appendChild(downloadLink);
      downloadLink.click();
      document.body.removeChild(downloadLink);
    }
  });
  return (
    <Box display={['block', 'flex']} flexDirection={'column'} h={'100%'}>
      <Card px={6} py={4}>
        <Flex>
          <Box flex={1} mr={1}>
            <Box fontSize={'xl'} fontWeight={'bold'}>
              训练数据管理
            </Box>
            <Box fontSize={'xs'} color={'blackAlpha.600'}>
              允许你将任意文本数据拆分成 QA 形式，或者进行文本摘要总结。
            </Box>
          </Box>
          <Button variant={'outline'} onClick={onOpenCreateDataModal}>
            创建数据集
          </Button>
        </Flex>
      </Card>
      {/* 数据表 */}
      <TableContainer
        mt={3}
        flex={'1 0 0'}
        h={['auto', '0']}
        overflowY={'auto'}
        px={6}
        py={4}
        backgroundColor={'white'}
        borderRadius={'md'}
        boxShadow={'base'}
      >
        <Table>
          <Thead>
            <Tr>
              <Th>集合名</Th>
              <Th>类型</Th>
              <Th>创建时间</Th>
              <Th>训练中 / 总数据</Th>
              <Th></Th>
            </Tr>
          </Thead>
          <Tbody>
            {dataList.map((item, i) => (
              <Tr key={item._id}>
                <Td>
                  <Input
                    minW={'150px'}
                    placeholder="请输入数据集名称"
                    defaultValue={item.name}
                    size={'sm'}
                    onBlur={(e) => {
                      if (!e.target.value || e.target.value === item.name) return;
                      updateDataName(item._id, e.target.value);
                    }}
                  />
                </Td>
                <Td>{DataTypeTextMap[item.type || 'QA']}</Td>
                <Td>{dayjs(item.createTime).format('YYYY/MM/DD HH:mm')}</Td>
                <Td>
                  {item.trainingData} / {item.totalData}
                </Td>
                <Td>
                  <Button
                    size={'sm'}
                    variant={'outline'}
                    colorScheme={'gray'}
                    mr={2}
                    onClick={() =>
                      router.push(`/data/detail?dataId=${item._id}&dataName=${item.name}`)
                    }
                  >
                    详细
                  </Button>
                  <Button
                    size={'sm'}
                    variant={'outline'}
                    mr={2}
                    onClick={() => setImportDataId(item._id)}
                  >
                    导入
                  </Button>
                  {/* <Menu>
                    <MenuButton as={Button} mr={2} size={'sm'} isLoading={isExporting}>
                      导出
                    </MenuButton>
                    <MenuList>
                      {item.type === 'QA' && (
                        <MenuItem onClick={() => handleExportData({ data: item, type: 'jsonl' })}>
                          jsonl
                        </MenuItem>
                      )}
                      {item.type === 'abstract' && (
                        <MenuItem onClick={() => handleExportData({ data: item, type: 'txt' })}>
                          txt
                        </MenuItem>
                      )}
                    </MenuList>
                  </Menu> */}
                  <Button
                    size={'sm'}
                    colorScheme={'red'}
                    isLoading={isDeleting}
                    onClick={openConfirm(() => handleDelData(item._id))}
                  >
                    删除
                  </Button>
                </Td>
              </Tr>
            ))}
          </Tbody>
        </Table>
      </TableContainer>
      {ImportDataId && (
        <ImportDataModal
          dataId={ImportDataId}
          onClose={() => setImportDataId(undefined)}
          onSuccess={refetch}
        />
      )}
      {isOpenCreateDataModal && (
        <CreateDataModal onClose={onCloseCreateDataModal} onSuccess={refetch} />
      )}
      <ConfirmChild />
    </Box>
  );
 };
 export default DataList;
--- a/src/pages/model/detail/components/SelectUrlModal.tsx
+++ b/src/pages/model/detail/components/SelectUrlModal.tsx
@@ -13,15 +13,11 @@ import {
  Textarea
 } from '@chakra-ui/react';
 import { useToast } from '@/hooks/useToast';
 import { customAlphabet } from 'nanoid';
 import { encode } from 'gpt-token-utils';
 import { useConfirm } from '@/hooks/useConfirm';
 import { useMutation } from '@tanstack/react-query';
 import { postModelDataSplitData, getWebContent } from '@/api/model';
 import { formatPrice } from '@/utils/user';
 const nanoid = customAlphabet('abcdefghijklmnopqrstuvwxyz1234567890', 12);
 const SelectUrlModal = ({
  onClose,
  onSuccess,
@@ -106,9 +102,6 @@ const SelectUrlModal = ({
            根据网站地址，获取网站文本内容（请注意仅能获取静态网站文本，注意看下获取后的内容是否正确）。模型会对文本进行
            QA 拆分，需要较长训练时间，拆分需要消耗 tokens，账号余额不足时，未拆分的数据会被删除。
          </Box>
          <Box mt={2}>
            一共 {encode(webText).length} 个tokens，大约 {formatPrice(encode(webText).length * 3)}元
          </Box>
          <Flex w={'100%'} alignItems={'center'} my={4}>
            <Box flex={'0 0 70px'}>网站地址</Box>
            <Input
--- a/src/service/events/generateAbstract.ts
+++ b/src/service/events/generateAbstract.ts
@@ -4,7 +4,7 @@ import { httpsAgent } from '@/service/utils/tools';
 import { getOpenApiKey } from '../utils/openai';
 import type { ChatCompletionRequestMessage } from 'openai';
 import { DataItemSchema } from '@/types/mongoSchema';
-import { ChatModelNameEnum } from '@/constants/model';
+import { ChatModelEnum } from '@/constants/model';
 import { pushSplitDataBill } from '@/service/events/pushBill';
 export async function generateAbstract(next = false): Promise<any> {
@@ -68,7 +68,7 @@ export async function generateAbstract(next = false): Promise<any> {
    // 请求 chatgpt 获取摘要
    const abstractResponse = await chatAPI.createChatCompletion(
      {
-        model: ChatModelNameEnum.GPT35,
+        model: ChatModelEnum.GPT35,
        temperature: 0.8,
        n: 1,
        messages: [
--- a/src/service/events/generateQA.ts
+++ b/src/service/events/generateQA.ts
@@ -3,7 +3,7 @@ import { getOpenAIApi } from '@/service/utils/auth';
 import { httpsAgent } from '@/service/utils/tools';
 import { getOpenApiKey } from '../utils/openai';
 import type { ChatCompletionRequestMessage } from 'openai';
-import { ChatModelNameEnum } from '@/constants/model';
+import { ChatModelEnum } from '@/constants/model';
 import { pushSplitDataBill } from '@/service/events/pushBill';
 import { generateVector } from './generateVector';
 import { openaiError2 } from '../errorCode';
@@ -84,7 +84,7 @@ A2:
        chatAPI
          .createChatCompletion(
            {
-              model: ChatModelNameEnum.GPT35,
+              model: ChatModelEnum.GPT35,
              temperature: 0.8,
              n: 1,
              messages: [
--- a/src/service/events/pushBill.ts
+++ b/src/service/events/pushBill.ts
@@ -1,27 +1,34 @@
 import { connectToDatabase, Bill, User } from '../mongo';
-import { modelList, ChatModelNameEnum } from '@/constants/model';
+import {
-import { encode } from 'gpt-token-utils';
+  modelList,
  ChatModelEnum,
  ModelNameEnum,
  Model2ChatModelMap,
  embeddingModel
 } from '@/constants/model';
 import { BillTypeEnum } from '@/constants/user';
 import type { DataType } from '@/types/data';
 import { countChatTokens } from '@/utils/tools';
 export const pushChatBill = async ({
  isPay,
  modelName,
  userId,
  chatId,
-  text
+  messages
 }: {
  isPay: boolean;
-  modelName: string;
+  modelName: `${ModelNameEnum}`;
  userId: string;
  chatId?: '' | string;
-  text: string;
+  messages: { role: 'system' | 'user' | 'assistant'; content: string }[];
 }) => {
-  let billId;
+  let billId = '';
  try {
    // 计算 token 数量
-    const tokens = Math.floor(encode(text).length * 0.75);
+    const tokens = countChatTokens({ model: Model2ChatModelMap[modelName] as any, messages });
    const text = messages.map((item) => item.content).join('');
    console.log(
      `chat generate success. text len: ${text.length}. token len: ${tokens}. pay:${isPay}`
@@ -88,7 +95,7 @@ export const pushSplitDataBill = async ({
    if (isPay) {
      try {
        // 获取模型单价格, 都是用 gpt35 拆分
-        const modelItem = modelList.find((item) => item.model === ChatModelNameEnum.GPT35);
+        const modelItem = modelList.find((item) => item.model === ChatModelEnum.GPT35);
        const unitPrice = modelItem?.price || 3;
        // 计算价格
        const price = unitPrice * tokenLen;
@@ -97,7 +104,7 @@ export const pushSplitDataBill = async ({
        const res = await Bill.create({
          userId,
          type,
-          modelName: ChatModelNameEnum.GPT35,
+          modelName: ChatModelEnum.GPT35,
          textLen: text.length,
          tokenLen,
          price
@@ -149,7 +156,7 @@ export const pushGenerateVectorBill = async ({
        const res = await Bill.create({
          userId,
          type: BillTypeEnum.vector,
-          modelName: ChatModelNameEnum.VECTOR,
+          modelName: embeddingModel,
          textLen: text.length,
          tokenLen,
          price
--- a/src/service/utils/openai.ts
+++ b/src/service/utils/openai.ts
@@ -5,7 +5,7 @@ import { getOpenAIApi } from '@/service/utils/auth';
 import { httpsAgent } from './tools';
 import { User } from '../models/user';
 import { formatPrice } from '@/utils/user';
-import { ChatModelNameEnum } from '@/constants/model';
+import { embeddingModel } from '@/constants/model';
 import { pushGenerateVectorBill } from '../events/pushBill';
 /* 获取用户 api 的 openai 信息 */
@@ -80,7 +80,7 @@ export const openaiCreateEmbedding = async ({
  const res = await chatAPI
    .createEmbedding(
      {
-        model: ChatModelNameEnum.VECTOR,
+        model: embeddingModel,
        input: text
      },
      {
@@ -134,11 +134,11 @@ export const gpt35StreamResponse = ({
        try {
          const json = JSON.parse(data);
          const content: string = json?.choices?.[0].delta.content || '';
          // console.log('content:', content);
          if (!content || (responseContent === '' && content === '\n')) return;
          responseContent += content;
-          !stream.destroyed && stream.push(content.replace(/\n/g, '<br/>'));
+
          if (!stream.destroyed && content) {
            stream.push(content.replace(/\n/g, '<br/>'));
          }
        } catch (error) {
          error;
        }
--- a/src/service/utils/tools.ts
+++ b/src/service/utils/tools.ts
@@ -2,10 +2,12 @@ import type { NextApiRequest } from 'next';
 import crypto from 'crypto';
 import jwt from 'jsonwebtoken';
 import { ChatItemType } from '@/types/chat';
 import { encode } from 'gpt-token-utils';
 import { OpenApi, User } from '../mongo';
 import { formatPrice } from '@/utils/user';
 import { ERROR_ENUM } from '../errorCode';
 import { countChatTokens } from '@/utils/tools';
 import { ChatCompletionRequestMessageRoleEnum } from 'openai';
 import { ChatModelEnum } from '@/constants/model';
 /* 密码加密 */
 export const hashPassword = (psw: string) => {
@@ -86,8 +88,16 @@ export const authOpenApiKey = async (req: NextApiRequest) => {
 export const httpsAgent = (fast: boolean) =>
  fast ? global.httpsAgentFast : global.httpsAgentNormal;
-/* tokens 截断 */
+/* 聊天内容 tokens 截断 */
-export const openaiChatFilter = (prompts: ChatItemType[], maxTokens: number) => {
+export const openaiChatFilter = ({
  model,
  prompts,
  maxTokens
 }: {
  model: `${ChatModelEnum}`;
  prompts: ChatItemType[];
  maxTokens: number;
 }) => {
  const formatPrompts = prompts.map((item) => ({
    obj: item.obj,
    value: item.value
@@ -97,41 +107,64 @@ export const openaiChatFilter = (prompts: ChatItemType[], maxTokens: number) =>
      .trim()
  }));
-  let res: ChatItemType[] = [];
+  let chats: ChatItemType[] = [];
  let systemPrompt: ChatItemType | null = null;
  //  System 词保留
  if (formatPrompts[0]?.obj === 'SYSTEM') {
    systemPrompt = formatPrompts.shift() as ChatItemType;
    maxTokens -= encode(formatPrompts[0].value).length;
  }
-  // 从后往前截取
+  // 格式化文本内容成 chatgpt 格式
  const map = {
    Human: ChatCompletionRequestMessageRoleEnum.User,
    AI: ChatCompletionRequestMessageRoleEnum.Assistant,
    SYSTEM: ChatCompletionRequestMessageRoleEnum.System
  };
  let messages: { role: ChatCompletionRequestMessageRoleEnum; content: string }[] = [];
  // 从后往前截取对话内容
  for (let i = formatPrompts.length - 1; i >= 0; i--) {
-    const tokens = encode(formatPrompts[i].value).length;
+    chats.unshift(formatPrompts[i]);
-    res.unshift(formatPrompts[i]);
+
    messages = (systemPrompt ? [systemPrompt, ...chats] : chats).map((item) => ({
      role: map[item.obj],
      content: item.value
    }));
    const tokens = countChatTokens({
      model,
      messages
    });
    /* 整体 tokens 超出范围 */
    if (tokens >= maxTokens) {
      break;
    }
    maxTokens -= tokens;
  }
-  return systemPrompt ? [systemPrompt, ...res] : res;
+  return messages;
 };
 /* system 内容截断 */
-export const systemPromptFilter = (prompts: string[], maxTokens: number) => {
+export const systemPromptFilter = ({
  model,
  prompts,
  maxTokens
 }: {
  model: 'gpt-4' | 'gpt-4-32k' | 'gpt-3.5-turbo';
  prompts: string[];
  maxTokens: number;
 }) => {
  let splitText = '';
  // 从前往前截取
  for (let i = 0; i < prompts.length; i++) {
-    const prompt = prompts[i];
+    const prompt = prompts[i].replace(/\n+/g, '\n');
    splitText += `${prompt}\n`;
-    const tokens = encode(splitText).length;
+    const tokens = countChatTokens({ model, messages: [{ role: 'system', content: splitText }] });
    if (tokens >= maxTokens) {
      break;
    }
--- a/src/types/mongoSchema.d.ts
+++ b/src/types/mongoSchema.d.ts
@@ -2,8 +2,9 @@ import type { ChatItemType } from './chat';
 import {
  ModelStatusEnum,
  TrainingStatusEnum,
-  ChatModelNameEnum,
+  ModelNameEnum,
-  ModelVectorSearchModeEnum
+  ModelVectorSearchModeEnum,
  ChatModelEnum
 } from '@/constants/model';
 import type { DataType } from './data';
@@ -45,8 +46,8 @@ export interface ModelSchema {
  };
  service: {
    trainId: string; // 训练的模型，训练后就是训练的模型id
-    chatModel: string; // 聊天时用的模型，训练后就是训练的模型
+    chatModel: `${ChatModelEnum}`; // 聊天时用的模型，训练后就是训练的模型
-    modelName: `${ChatModelNameEnum}`; // 底层模型名称，不会变
+    modelName: `${ModelNameEnum}`; // 底层模型名称，不会变
  };
  security: {
    domain: string[];
--- a/src/utils/tools.ts
+++ b/src/utils/tools.ts
@@ -2,6 +2,7 @@ import crypto from 'crypto';
 import { useToast } from '@/hooks/useToast';
 import { encoding_for_model, type Tiktoken } from '@dqbd/tiktoken';
 import Graphemer from 'graphemer';
 import { ChatModelEnum } from '@/constants/model';
 const textDecoder = new TextDecoder();
 const graphemer = new Graphemer();
@@ -124,7 +125,7 @@ export const countChatTokens = ({
  model = 'gpt-3.5-turbo',
  messages
 }: {
-  model?: 'gpt-4' | 'gpt-4-32k' | 'gpt-3.5-turbo';
+  model?: `${ChatModelEnum}`;
  messages: { role: 'system' | 'user' | 'assistant'; content: string }[];
 }) => {
  const text = getChatGPTEncodingText(messages, model);