Feat: Change “Document parser” to "PDF parser" #6072 (#6073)

### What problem does this PR solve?

Feat: Change “Document parser” to "PDF parser" #6072

### Type of change


- [x] New Feature (non-breaking change which adds functionality)
This commit is contained in:
balibabu
2025-03-14 12:03:35 +08:00
committed by GitHub
parent 7463241896
commit c85b468b8d
3 changed files with 12 additions and 12 deletions

View File

@ -137,7 +137,7 @@ export default {
fromMessage: '缺少起始頁碼',
toPlaceholder: '到',
toMessage: '缺少結束頁碼(不包含)',
layoutRecognize: '文件解析器',
layoutRecognize: 'PDF解析器',
layoutRecognizeTip:
'使用視覺模型進行 PDF 布局分析,以更好地識別文檔結構,找到標題、文字塊、圖像和表格的位置。若選擇 Naive 選項,則只能取得 PDF 的純文字。請注意此功能僅適用於 PDF 文檔,對其他文檔不生效。',
taskPageSize: '任務頁面大小',
@ -159,7 +159,7 @@ export default {
rerankTip: `如果是空的。它使用查詢和塊的嵌入來構成矢量餘弦相似性。否則它使用rerank評分代替矢量餘弦相似性。`,
topK: 'Top-K',
topKTip: `K塊將被送入Rerank型號。`,
delimiter: `分段標識符`,
delimiter: `文字分段標識符`,
delimiterTip:
'支援多字元作為分隔符,多字元分隔符用`包裹。如配置成這樣:\n`##`;那麼就會用換行,兩個#以及分號先對文字進行分割,然後按照「 token number」大小進行拼裝。',
html4excel: '表格轉HTML',
@ -206,7 +206,7 @@ export default {
languagePlaceholder: '請輸入語言',
permissions: '權限',
embeddingModel: '嵌入模型',
chunkTokenNumber: '塊Token數',
chunkTokenNumber: '文字的區塊標記編號',
chunkTokenNumberMessage: '塊Token數是必填項',
embeddingModelTip:
'用於嵌入塊的嵌入模型。一旦知識庫有了塊,它就無法更改。如果你想改變它,你需要刪除所有的塊。',