feat: custom dataset split sign (#4221)

* feat: custom dataset split sign * feat: custom dataset split sign
2025-07-22 20:37:48 +00:00 · 2025-03-18 23:15:20 +08:00
parent cb29076e5b
commit ec30d79286
9 changed files with 121 additions and 26 deletions
--- a/packages/web/i18n/zh-Hant/common.json
+++ b/packages/web/i18n/zh-Hant/common.json
@@ -569,7 +569,6 @@
  "core.dataset.import.Custom process desc": "自訂設定資料處理規則",
  "core.dataset.import.Custom prompt": "自訂提示詞",
  "core.dataset.import.Custom split char": "自訂分隔符",
-  "core.dataset.import.Custom split char Tips": "允許您根據自訂的分隔符進行分割。通常用於已處理好的資料，使用特定的分隔符來精確分割。",
  "core.dataset.import.Custom text": "自訂文字",
  "core.dataset.import.Custom text desc": "手動輸入一段文字作為資料集",
  "core.dataset.import.Data process params": "資料處理參數",
--- a/packages/web/i18n/zh-Hant/dataset.json
+++ b/packages/web/i18n/zh-Hant/dataset.json
@@ -25,6 +25,7 @@
  "core.dataset.import.Adjust parameters": "調整參數",
  "custom_data_process_params": "自訂",
  "custom_data_process_params_desc": "自訂資料處理規則",
+  "custom_split_sign_tip": "允許你根據自定義的分隔符進行分塊。\n通常用於已處理好的數據，使用特定的分隔符來精確分塊。\n可以使用 | 符號表示多個分割符，例如：“。|.” 表示中英文句號。\n\n盡量避免使用正則相關特殊符號，例如: * () [] {} 等。",
  "data.ideal_chunk_length": "理想分塊長度",
  "data_amount": "{{dataAmount}} 組數據, {{indexAmount}} 組索引",
  "data_index_num": "索引 {{index}}",
@@ -86,6 +87,14 @@
  "retain_collection": "調整訓練參數",
  "retrain_task_submitted": "重新訓練任務已提交",
  "same_api_collection": "存在相同的 API 集合",
+  "split_sign_break": "1 個換行符",
+  "split_sign_break2": "2 個換行符",
+  "split_sign_custom": "自定義",
+  "split_sign_exclamatiob": "驚嘆號",
+  "split_sign_null": "不設置",
+  "split_sign_period": "句號",
+  "split_sign_question": "問號",
+  "split_sign_semicolon": "分號",
  "start_sync_website_tip": "確認開始同步資料？\n將會刪除舊資料後重新獲取，請確認！",
  "sync_collection_failed": "同步集合錯誤，請檢查是否能正常存取來源文件",
  "sync_schedule": "定時同步",