何が実装されました
「フォーラム検索」AIアーエント(ID=5)が作成されました。これはdiscuss.rabkesov.ruのフォーラム資料に対してセマンティック検索を行い、インターネットからの情報で結果を補完する機能を備えています。
アーエント
- ボットユーザー:
Поиск_по_форуму_bot(user_id=-1202) - LLM: qwen3-VL-8b(ローカル、vanill.ddns.net:54321)
- 管理画面: ai-agents/5/edit
インターフェース
| インターフェース | 機能 | パラメータ |
|---|---|---|
| Search | セマンティック+キーワード検索 | max_results=20, search_private=true |
| Read | フォーラムトピックの全文読み込み | read_private=true |
| Researcher | 複数トピックの深層分析・統合 | max_results=10, LLM=qwen3-VL-8b |
| WebBrowser | ウェブページ閲覧(Web補完用) | - |
行動規則
- すべてのクエリに対してフォーラム内のみで検索(Search + Read + Researcher)
- 各事実にはトピック/投稿へのリンクで引用
- 最後に「インターネット情報で結果を補完しますか?」と尋ねる
- 確認された場合、WebBrowserを使用して優先サイトを検索:
- 質問の言語に応じて回答
使い方
- 任意のトピック内で
@Поиск_по_форуму_botをメンション - ボットに個人メッセージを送信
- AI-ボット会話経由
エンベディングモデルの変更:nomic v1.5 → v2-moe
問題
nomic-embed-text-v1.5 モデルは言語でテキストをグループ化し、意味で分類しない。テスト:
| ペア | コサイン類似度 |
|---|---|
| RU「vLLM設定」←→EN「vLLM設定」(同一テーマ) | 0.634 |
| RU「vLLM設定」←→RU「ブリーチのレシピ」(異なるテーマ) | 0.650 |
| 間隔(意味による分離) | -0.016 |
vLLMに関するロシア語テキストは、vLLMに関する英語テキストよりも「ブリーチのレシピ」のロシア語テキストに近い類似度を示す。このモデルでは、ロシア語フォーラムのセマンティック検索が不正確だった。
解決策
nomic-embed-text-v2-moe(MoE、8x277M、512 MB Q8_0、100+言語対応)に変更。結果:
| ペア | v1.5 | v2-moe |
|---|---|---|
| RU「vLLM」←→EN「vLLM」(同一テーマ) | 0.634 | 0.924 |
| RU「vLLM」←→RU「ブリーチ」(異なるテーマ) | 0.650 | 0.163 |
| 間隔 | -0.016 | +0.761 |
エンベディング設定(最終版)
| パラメータ | 値 |
|---|---|
ai_embeddings_enabled |
true |
ai_embeddings_selected_model |
12(nomic-embed-text-v2-moe) |
ai_embeddings_semantic_search_enabled |
true |
ai_embeddings_semantic_search_use_hyde |
true |
ai_embeddings_semantic_search_hyde_agent |
-32(「コンテンツ作成者」) |
ai_embeddings_semantic_quick_search_enabled |
true |
nomic-embed-text-v2-moe モデルはLM Studioで常にロードされる必要があります(約488 MB VRAM)。モデル変更後、Sidekiqが自動的にエンベディングのバックフィルを実行します。
限定:Web検索
Google検索(完全なWeb検索)は利用できません。ai_google_custom_search_api_key が設定されていないため。アーエントはWebBrowserを使用して特定のURLを検索します。完全なインターネット検索を行うには:
- Google Custom Search Engine を登録し、APIキーとCXを取得
- AI設定 に記載
LLMサーバーのログ
パス:~/.lmstudio/server-logs/YYYY-MM/YYYY-MM-DD.N.log
- 月ごとにフォルダを分割、日付ごとにファイル
- N:当日のローテーション番号
- 例:
~/.lmstudio/server-logs/2026-03/2026-03-30.1.log