KI-Agent „Forum-Suche“: Einstellung semantischer Suche und Embeddings

system · 30. März 2026 um 15:52

Was getan wurde

Ein AI-Agent „Forum-Suche“ (ID=5) wurde für semantische Suche in den Inhalten des Forums discuss.rabkesov.ru erstellt, mit der Möglichkeit, Ergebnisse durch Internet-Enrichment zu ergänzen.

Agent

Bot-Benutzer: Suche_im_Forum_bot (user_id=-1202)
LLM: qwen3-VL-8b (lokal, vanill.ddns.net:54321)
Admin-Interface: ai-agents/5/edit

Werkzeuge

Werkzeug	Zweck	Parameter
Search	Semantische + Keyword-Suche	max_results=20, search_private=true
Read	Vollständige Lektüre von Threads	read_private=true
Researcher	Tiefgehende Analyse/Synthese aus mehreren Threads	max_results=10, LLM=qwen3-VL-8b
WebBrowser	Webseiten-Browsing (für Web-Enrichment)	-

Verhalten

Jede Anfrage wird ausschließlich innerhalb des Forums durchgeführt (Search + Read + Researcher)
Jeder Fakt wird mit einem Link zum Thread/Post zitiert
Am Ende fragt der Agent: „Möchten Sie die Ergebnisse mit Informationen aus dem Internet ergänzen?“
Bei Bestätigung verwendet er WebBrowser zur Priorisierung bestimmter Webseiten:
- habr.com, meta.discourse.org, stackoverflow.com, github.com
- Kubernetes Documentation | Kubernetes, docs.ansible.com, wiki.archlinux.org
Antwortet auf der Sprache der Frage

Wie man es nutzt

Erwähne @Suche_im_Forum_bot in jedem Thread
Sendet eine private Nachricht an den Bot
Über AI-Bot-Conversations

Ersetzung der Embedding-Modell: nomic v1.5 → v2-moe

Problem

Die Modell nomic-embed-text-v1.5 gruppieren Texte nach Sprache, nicht nach Bedeutung. Test:

Paar	Cosine-Similarität
RU „vLLM-Einstellung“ ←→ EN „vLLM-Konfiguration“ (gleiche Thematik)	0.634
RU „vLLM-Einstellung“ ←→ RU „Borscht-Rezept“ (unterschiedliche Themen)	0.650
Gap (Trennung nach Bedeutung)	-0.016

Russischer Text über vLLM ist näher an russischem Borscht-Rezept als an englischen Text über vLLM. Der semantische Suchvorgang auf dem russischsprachigen Forum funktionierte mit dieser Modell nicht korrekt.

Lösung

Geändert auf nomic-embed-text-v2-moe (MoE, 8x277M, 512 MB Q8_0, 100+ Sprachen). Ergebnis:

Paar	v1.5	v2-moe
RU „vLLM“ ←→ EN „vLLM“ (gleiche Thematik)	0.634	0.924
RU „vLLM“ ←→ RU „Borscht“ (unterschiedliche Themen)	0.650	0.163
Gap	-0.016	+0.761

Embedding-Einstellungen (Endgültig)

Parameter	Wert
`ai_embeddings_enabled`	true
`ai_embeddings_selected_model`	12 (nomic-embed-text-v2-moe)
`ai_embeddings_semantic_search_enabled`	true
`ai_embeddings_semantic_search_use_hyde`	true
`ai_embeddings_semantic_search_hyde_agent`	-32 („Inhaltsersteller“)
`ai_embeddings_semantic_quick_search_enabled`	true

Das Modell nomic-embed-text-v2-moe sollte kontinuierlich in LM Studio geladen werden (~488 MB VRAM). Der Backfill der Embeddings wird automatisch durch Sidekiq nach dem Wechsel des Modells gestartet.

Einschränkung: Web-Suche

Das Google-Tool (vollständige Web-Suche) ist nicht verfügbar — ai_google_custom_search_api_key ist nicht konfiguriert. Der Agent verwendet WebBrowser zur Besuch von bestimmten URLs. Für eine vollständige Internet-Suche ist erforderlich:

Eine Google Custom Search Engine zu registrieren und API-Key + CX zu erhalten
In den AI-Einstellungen einzutragen

LLM-Server-Logs

Pfad: ~/.lmstudio/server-logs/YYYY-MM/YYYY-MM-DD.N.log

Monatliche Rotation in Ordnern, innerhalb nach Tagen
N = Rotationnummer pro Tag
Beispiel: ~/.lmstudio/server-logs/2026-03/2026-03-30.1.log

Thema		Antworten	Aufrufe
Self-hosted Discourse AI Sentiment: GPU и CPU варианты AI документация	0	37	30. März 2026
AI для разработчика (часть 1, IDE) AI диаграмма	1	34	7. Juli 2025
Руководство к действию в любой ситуации Мысль дня	0	37	6. Juli 2025
Курс обучения чему-либо должен быть интересным Основная	2	57	14. November 2025
Токены и стоимость (обучение от Cursor) AI документация	0	40	10. Februar 2026