Feat: Change “Document parser” to "PDF parser" #6072 (#6073)

### What problem does this PR solve?

Feat: Change “Document parser” to "PDF parser" #6072

### Type of change


- [x] New Feature (non-breaking change which adds functionality)
This commit is contained in:
balibabu
2025-03-14 12:03:35 +08:00
committed by GitHub
parent 7463241896
commit c85b468b8d
3 changed files with 12 additions and 12 deletions

View File

@ -137,7 +137,7 @@ export default {
fromMessage: '缺少起始页码',
toPlaceholder: '到',
toMessage: '缺少结束页码(不包含)',
layoutRecognize: '文档解析器',
layoutRecognize: 'PDF解析器',
layoutRecognizeTip:
'使用视觉模型进行 PDF 布局分析,以更好地识别文档结构,找到标题、文本块、图像和表格的位置。 如果选择 Naive 选项,则只能获取 PDF 的纯文本。请注意该功能只适用于 PDF 文档,对其他文档不生效。',
taskPageSize: '任务页面大小',
@ -159,7 +159,7 @@ export default {
rerankTip: `非必选项:若不选择 rerank 模型,系统将默认采用关键词相似度与向量余弦相似度相结合的混合查询方式;如果设置了 rerank 模型,则混合查询中的向量相似度部分将被 rerank 打分替代。请注意:采用 rerank 模型会非常耗时。`,
topK: 'Top-K',
topKTip: `K块将被送入Rerank型号。`,
delimiter: `分段标识符`,
delimiter: `文本分段标识符`,
delimiterTip:
'支持多字符作为分隔符,多字符分隔符用`包裹。如配置成这样:\n`##`;那么就会用换行,两个#以及分号先对文本进行分割,然后按照“ token number”大小进行拼装。',
html4excel: '表格转HTML',
@ -206,7 +206,7 @@ export default {
languagePlaceholder: '请输入语言',
permissions: '权限',
embeddingModel: '嵌入模型',
chunkTokenNumber: '块Token数',
chunkTokenNumber: '文本的块标记编号',
chunkTokenNumberMessage: '块Token数是必填项',
embeddingModelTip:
'用于嵌入块的嵌入模型。 一旦知识库有了块,它就无法更改。 如果你想改变它,你需要删除所有的块。',