mirror of
https://github.com/infiniflow/ragflow.git
synced 2026-01-01 17:45:28 +08:00
Miscellaneous updates (#6245)
### What problem does this PR solve? ### Type of change - [x] Documentation Update
This commit is contained in:
@ -164,9 +164,9 @@ export default {
|
||||
'支持多字符作为分隔符,多字符分隔符用`包裹。如配置成这样:\n`##`;那么就会用换行,两个#以及分号先对文本进行分割,然后按照“ token number”大小进行拼装。',
|
||||
html4excel: '表格转HTML',
|
||||
html4excelTip: `开启后电子表格会被解析为 HTML 表格,每张表格最多 256 行,否则会按行解析为键值对。`,
|
||||
autoKeywords: '自动关键词',
|
||||
autoKeywordsTip: `在查询此类关键词时,为每个块提取 N 个关键词以提高其排名得分。在“系统模型设置”中设置的 LLM 将消耗额外的 token。您可以在块列表中查看结果。`,
|
||||
autoQuestions: '自动问题',
|
||||
autoKeywords: '自动关键词提取',
|
||||
autoKeywordsTip: `自动为每个文本块中提取 N 个关键词,用以提升查询精度。请注意:该功能采用“系统模型设置”中设置的默认聊天模型提取关键词,因此也会产生更多 Token 消耗。另外,你也可以手动更新生成的关键词。`,
|
||||
autoQuestions: '自动问题提取',
|
||||
autoQuestionsTip: `在查询此类问题时,为每个块提取 N 个问题以提高其排名得分。在“系统模型设置”中设置的 LLM 将消耗额外的 token。您可以在块列表中查看结果。如果发生错误,此功能不会破坏整个分块过程,除了将空结果添加到原始块。`,
|
||||
redo: '是否清空已有 {{chunkNum}}个 chunk?',
|
||||
setMetaData: '设置元数据',
|
||||
@ -240,7 +240,7 @@ export default {
|
||||
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
|
||||
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
|
||||
</p>`,
|
||||
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
|
||||
naive: `<p>支持的文件格式为<b>DOCX、XLSX、XLS (Excel97~2003)、PPT、PDF、TXT、JPEG、JPG、PNG、TIF、GIF、CSV、JSON、EML、HTML</b>。</p>
|
||||
<p>此方法将简单的方法应用于块文件:</p>
|
||||
<p>
|
||||
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
|
||||
@ -365,8 +365,9 @@ export default {
|
||||
<ul>
|
||||
<li>标签集是一个由用户定义和管理的封闭集,而自动生成的关键词属于开放集合。 </li>
|
||||
<li>在给你的知识库文本块批量打标签之前,你需要先生成标签集作为样本。 </li>
|
||||
<li>自动关键词功能中的关键词由 LLM 生成,此过程相对耗时,并且会产生一定的 Token 消耗。 </li>
|
||||
<li>自动关键词提取功能中的关键词由 LLM 生成,此过程相对耗时,并且会产生一定的 Token 消耗。 </li>
|
||||
</ul>
|
||||
<p> 详见:https://ragflow.io/docs/dev/use_tag_sets </p>
|
||||
`,
|
||||
tags: '标签',
|
||||
addTag: '增加标签',
|
||||
|
||||
Reference in New Issue
Block a user