Docs: From v0.13.0 onwards, markdown chunking is added to the General chunking method. (#7883)

### What problem does this PR solve?

### Type of change

- [x] Documentation Update
This commit is contained in:
writinwaters
2025-05-27 16:33:14 +08:00
committed by GitHub
parent 590070e47d
commit 13528ec328
13 changed files with 14 additions and 14 deletions

View File

@ -255,7 +255,7 @@ export default {
manual: `<p>Nur <b>PDF</b> wird unterstützt.</p><p>
Wir gehen davon aus, dass das Handbuch eine hierarchische Abschnittsstruktur aufweist und verwenden die Titel der untersten Abschnitte als Grundeinheit für die Aufteilung der Dokumente. Daher werden Abbildungen und Tabellen im selben Abschnitt nicht getrennt, was zu größeren Chunk-Größen führen kann.
</p>`,
naive: `<p>Unterstützte Dateiformate sind <b>DOCX, XLSX, XLS (Excel 97-2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>
naive: `<p>Unterstützte Dateiformate sind <b>MD, MDX, DOCX, XLSX, XLS (Excel 97-2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>
<p>Diese Methode teilt Dateien mit einer 'naiven' Methode auf: </p>
<p>
<li>Verwenden eines Erkennungsmodells, um die Texte in kleinere Segmente aufzuteilen.</li>