AIアーエント「フォーラム検索」:セマンティック検索と埋め込みの設定

何が実装されました

「フォーラム検索」AIアーエント(ID=5)が作成されました。これはdiscuss.rabkesov.ruのフォーラム資料に対してセマンティック検索を行い、インターネットからの情報で結果を補完する機能を備えています。

アーエント

インターフェース

インターフェース 機能 パラメータ
Search セマンティック+キーワード検索 max_results=20, search_private=true
Read フォーラムトピックの全文読み込み read_private=true
Researcher 複数トピックの深層分析・統合 max_results=10, LLM=qwen3-VL-8b
WebBrowser ウェブページ閲覧(Web補完用) -

行動規則

  1. すべてのクエリに対してフォーラム内のみで検索(Search + Read + Researcher)
  2. 各事実にはトピック/投稿へのリンクで引用
  3. 最後に「インターネット情報で結果を補完しますか?」と尋ねる
  4. 確認された場合、WebBrowserを使用して優先サイトを検索:
  5. 質問の言語に応じて回答

使い方

  • 任意のトピック内で @Поиск_по_форуму_bot をメンション
  • ボットに個人メッセージを送信
  • AI-ボット会話経由

エンベディングモデルの変更:nomic v1.5 → v2-moe

問題

nomic-embed-text-v1.5 モデルは言語でテキストをグループ化し、意味で分類しない。テスト:

ペア コサイン類似度
RU「vLLM設定」←→EN「vLLM設定」(同一テーマ) 0.634
RU「vLLM設定」←→RU「ブリーチのレシピ」(異なるテーマ) 0.650
間隔(意味による分離) -0.016

vLLMに関するロシア語テキストは、vLLMに関する英語テキストよりも「ブリーチのレシピ」のロシア語テキストに近い類似度を示す。このモデルでは、ロシア語フォーラムのセマンティック検索が不正確だった。

解決策

nomic-embed-text-v2-moe(MoE、8x277M、512 MB Q8_0、100+言語対応)に変更。結果:

ペア v1.5 v2-moe
RU「vLLM」←→EN「vLLM」(同一テーマ) 0.634 0.924
RU「vLLM」←→RU「ブリーチ」(異なるテーマ) 0.650 0.163
間隔 -0.016 +0.761

エンベディング設定(最終版)

パラメータ
ai_embeddings_enabled true
ai_embeddings_selected_model 12(nomic-embed-text-v2-moe)
ai_embeddings_semantic_search_enabled true
ai_embeddings_semantic_search_use_hyde true
ai_embeddings_semantic_search_hyde_agent -32(「コンテンツ作成者」)
ai_embeddings_semantic_quick_search_enabled true

nomic-embed-text-v2-moe モデルはLM Studioで常にロードされる必要があります(約488 MB VRAM)。モデル変更後、Sidekiqが自動的にエンベディングのバックフィルを実行します。

限定:Web検索

Google検索(完全なWeb検索)は利用できません。ai_google_custom_search_api_key が設定されていないため。アーエントはWebBrowserを使用して特定のURLを検索します。完全なインターネット検索を行うには:

LLMサーバーのログ

パス:~/.lmstudio/server-logs/YYYY-MM/YYYY-MM-DD.N.log

  • 月ごとにフォルダを分割、日付ごとにファイル
  • N:当日のローテーション番号
  • 例:~/.lmstudio/server-logs/2026-03/2026-03-30.1.log