UI updates. (#6398)

### What problem does this PR solve?

Updated UI descriptions for delimiters and recommended chunk size

### Type of change

- [x] Documentation Update
This commit is contained in:
writinwaters
2025-03-21 16:50:20 +08:00
committed by GitHub
parent a2a4bfe3e3
commit 979cdc3626
11 changed files with 39 additions and 35 deletions

View File

@ -161,7 +161,7 @@ export default {
topKTip: `K块将被送入Rerank型号。`,
delimiter: `文本分段标识符`,
delimiterTip:
'支持多字符作为分隔符,多字符分隔符用`包裹。如配置成这样\n`##`;那么就会用换行两个#以及分号先对文本进行分割,然后按照“ token number”大小进行拼装。',
'支持多字符作为分隔符,多字符分隔符用 ` 包裹。如配置成:\\n`##`; 系统将首先使用换行符、两个#以及分号先对文本进行分割,随后再对分得的小文本块按照「建议文本块大小」设定的大小进行拼装。在设置文本分段标识符前请确保理解上述文本分段切片机制。',
html4excel: '表格转HTML',
html4excelTip: `开启后电子表格会被解析为 HTML 表格,每张表格最多 256 行,否则会按行解析为键值对。`,
autoKeywords: '自动关键词提取',
@ -206,12 +206,12 @@ export default {
languagePlaceholder: '请输入语言',
permissions: '权限',
embeddingModel: '嵌入模型',
chunkTokenNumber: '文本的块标记编号',
chunkTokenNumber: '建议文本块大小',
chunkTokenNumberMessage: '块Token数是必填项',
embeddingModelTip:
'用于嵌入块的嵌入模型。 一旦知识库有了块,它就无法更改。 如果你想改变它,你需要删除所有的块。',
permissionsTip: '如果权限是“团队”,则所有团队成员都可以操作知识库。',
chunkTokenNumberTip: '它大致确定了一个块的Token数量。',
permissionsTip: '如果把知识库权限设为“团队”,则所有团队成员都可以操作知识库。',
chunkTokenNumberTip: '建议的生成文本块的 token 数阈值。如果切分得到的小文本段 token 数达不到这一阈值就会不断与之后的文本段合并,直至再合并下一个文本段会超过这一阈值为止,此时产生一个最终文本块。如果系统在切分文本段时始终没有遇到文本分段标识符,即便文本段 token 数已经超过这一阈值,系统也不会生成新文本块。',
chunkMethod: '切片方法',
chunkMethodTip: '说明位于右侧。',
upload: '上传',
@ -1152,9 +1152,7 @@ General实体和关系提取提示来自 GitHub - microsoft/graphrag基于
jsonUploadTypeErrorMessage: '请上传json文件',
jsonUploadContentErrorMessage: 'json 文件错误',
iteration: '循环',
iterationDescription: `该组件首先将输入以“分隔符”分割成数组,然后依次对数组中的元素执行相同的操作步骤,直到输出所有结果,可以理解为一个任务批处理器。
例如在长文本翻译迭代节点中如果所有内容都输入到LLM节点可能会达到单次对话的限制上游节点可以先将长文本分割成多个片段配合迭代节点对每个片段进行批量翻译避免达到单次对话的LLM消息限制。`,
iterationDescription: `该组件首先将输入以“分隔符”分割成数组,然后依次对数组中的元素执行相同的操作步骤,直到输出所有结果,可以理解为一个任务批处理器。例如在长文本翻译迭代节点中如果所有内容都输入到LLM节点可能会达到单次对话的限制上游节点可以先将长文本分割成多个片段配合迭代节点对每个片段进行批量翻译避免达到单次对话的LLM消息限制。`,
delimiterTip: `该分隔符用于将输入文本分割成几个文本片段,每个文本片段的回显将作为每次迭代的输入项。`,
delimiterOptions: {
comma: '逗号',