AI论坛搜索代理：语义搜索与嵌入设置

system · 2026 年3 月 30 日 15:52

已完成事项

在论坛 discuss.rabkesov.ru 上创建了名为“论坛搜索”的 AI 代理（ID=5），支持语义搜索，并可结合互联网信息丰富搜索结果。

工具名称	功能说明	参数设置
Search	语义 + 关键词搜索	max_results=20, search_private=true
Read	阅读主题完整内容	read_private=true
Researcher	多主题深度分析与综合	max_results=10, LLM=qwen3-VL-8b
WebBrowser	浏览网页（用于网络信息丰富）	-

每次请求仅在论坛内搜索（Search + Read + Researcher）。
每个事实均附带主题/帖子链接。
回答末尾询问：“是否希望用互联网信息丰富结果？”
若确认，使用 WebBrowser 访问优先网站：
- habr.com、meta.discourse.org、stackoverflow.com、github.com
- kubernetes.io/docs、docs.ansible.com、wiki.archlinux.org
回答语言与提问语言一致。

模型 nomic-embed-text-v1.5 按语言而非语义对文本进行分组。测试结果：

俄语关于 vLLM 的内容，与俄语罗宋汤食谱的相似度，高于与英语 vLLM 内容的相似度。在俄语论坛上，使用该模型进行语义搜索效果不佳。

切换为 nomic-embed-text-v2-moe（MoE，8x277M，512 MB Q8_0，支持 100+ 种语言）。结果：

参数	值
`ai_embeddings_enabled`	true
`ai_embeddings_selected_model`	12（nomic-embed-text-v2-moe）
`ai_embeddings_semantic_search_enabled`	true
`ai_embeddings_semantic_search_use_hyde`	true
`ai_embeddings_semantic_search_hyde_agent`	-32（“内容作者”）
`ai_embeddings_semantic_quick_search_enabled`	true

模型 nomic-embed-text-v2-moe 需常驻 LM Studio（约 488 MB VRAM）。更换模型后，Sidekiq 会自动启动嵌入向量的回填任务。

Google 工具（完整网络搜索）不可用 —— ai_google_custom_search_api_key 未配置。代理使用 WebBrowser 访问特定 URL。如需完整网络搜索，请：

路径：~/.lmstudio/server-logs/YYYY-MM/YYYY-MM-DD.N.log

话题		回复	浏览量
Self-hosted Discourse AI Sentiment: GPU и CPU варианты AI документация	0	46	2026 年3 月 30 日
AI для разработчика (часть 1, IDE) AI диаграмма	1	47	2025 年7 月 7 日
Руководство к действию в любой ситуации Мысль дня	0	54	2025 年7 月 6 日
Курс обучения чему-либо должен быть интересным Основная	2	88	2025 年11 月 14 日
Токены и стоимость (обучение от Cursor) AI документация	0	58	2026 年2 月 10 日