Fix: tokenizer issue. (#11902)

#11786 ### Type of change - [x] Bug Fix (non-breaking change which fixes an issue)
2026-02-04 09:35:06 +08:00 · 2025-12-11 17:38:17 +08:00
parent 22a51a3868
commit ea4a5cd665
17 changed files with 141 additions and 216 deletions
--- a/api/apps/sdk/session.py
+++ b/api/apps/sdk/session.py
@ -13,7 +13,6 @@
 #  See the License for the specific language governing permissions and
 #  limitations under the License.
 #
-import asyncio
 import json
 import re
 import time
@ -44,6 +43,7 @@ from rag.prompts.generator import cross_languages, gen_meta_filter, keyword_extr
 from common.constants import RetCode, LLMType, StatusEnum
 from common import settings

+
@manager.route("/chats/<chat_id>/sessions", methods=["POST"])  # noqa: F821
@token_required
 async def create(tenant_id, chat_id):
@ -969,7 +969,7 @@ async def retrieval_test_embedded():
    if not tenant_id:
        return get_error_data_result(message="permission denined.")

-    def _retrieval_sync():
+    async def _retrieval():
        local_doc_ids = list(doc_ids) if doc_ids else []
        tenant_ids = []
        _question = question
@ -980,7 +980,7 @@ async def retrieval_test_embedded():
            metas = DocumentService.get_meta_by_kbs(kb_ids)
            if meta_data_filter.get("method") == "auto":
                chat_mdl = LLMBundle(tenant_id, LLMType.CHAT, llm_name=search_config.get("chat_id", ""))
-                filters: dict = gen_meta_filter(chat_mdl, metas, _question)
+                filters: dict = await gen_meta_filter(chat_mdl, metas, _question)
                local_doc_ids.extend(meta_filter(metas, filters["conditions"], filters.get("logic", "and")))
                if not local_doc_ids:
                    local_doc_ids = None
@ -990,7 +990,7 @@ async def retrieval_test_embedded():
                    filtered_metas = {key: metas[key] for key in selected_keys if key in metas}
                    if filtered_metas:
                        chat_mdl = LLMBundle(tenant_id, LLMType.CHAT, llm_name=search_config.get("chat_id", ""))
-                        filters: dict = gen_meta_filter(chat_mdl, filtered_metas, _question)
+                        filters: dict = await gen_meta_filter(chat_mdl, filtered_metas, _question)
                        local_doc_ids.extend(meta_filter(metas, filters["conditions"], filters.get("logic", "and")))
                        if not local_doc_ids:
                            local_doc_ids = None
@ -1004,7 +1004,7 @@ async def retrieval_test_embedded():
                metas = DocumentService.get_meta_by_kbs(kb_ids)
                if meta_data_filter.get("method") == "auto":
                    chat_mdl = LLMBundle(tenant_id, LLMType.CHAT)
-                    filters: dict = gen_meta_filter(chat_mdl, metas, question)
+                    filters: dict = await gen_meta_filter(chat_mdl, metas, question)
                    local_doc_ids.extend(meta_filter(metas, filters["conditions"], filters.get("logic", "and")))
                    if not local_doc_ids:
                        local_doc_ids = None
@ -1014,7 +1014,7 @@ async def retrieval_test_embedded():
                        filtered_metas = {key: metas[key] for key in selected_keys if key in metas}
                        if filtered_metas:
                            chat_mdl = LLMBundle(tenant_id, LLMType.CHAT)
-                            filters: dict = gen_meta_filter(chat_mdl, filtered_metas, question)
+                            filters: dict = await gen_meta_filter(chat_mdl, filtered_metas, question)
                            local_doc_ids.extend(meta_filter(metas, filters["conditions"], filters.get("logic", "and")))
                            if not local_doc_ids:
                                local_doc_ids = None
@ -1038,7 +1038,7 @@ async def retrieval_test_embedded():
            return get_error_data_result(message="Knowledgebase not found!")

        if langs:
-            _question = cross_languages(kb.tenant_id, None, _question, langs)
+            _question = await cross_languages(kb.tenant_id, None, _question, langs)

        embd_mdl = LLMBundle(kb.tenant_id, LLMType.EMBEDDING.value, llm_name=kb.embd_id)

@ -1048,7 +1048,7 @@ async def retrieval_test_embedded():

        if req.get("keyword", False):
            chat_mdl = LLMBundle(kb.tenant_id, LLMType.CHAT)
-            _question += keyword_extraction(chat_mdl, _question)
+            _question += await keyword_extraction(chat_mdl, _question)

        labels = label_question(_question, [kb])
        ranks = settings.retriever.retrieval(
@ -1068,7 +1068,7 @@ async def retrieval_test_embedded():
        return get_json_result(data=ranks)

    try:
-        return await asyncio.to_thread(_retrieval_sync)
+        return await _retrieval()
    except Exception as e:
        if str(e).find("not_found") > 0:
            return get_json_result(data=False, message="No chunk found! Check the chunk status please!",