AI 에이전트 "포럼 검색": 의미 검색 및 임베딩 설정

system · 3월 30, 2026, 3:52오후

무엇을 수행했는가

discuss.rabkesov.ru 포럼의 자료를 위한 “포럼 검색” AI 에이전트(ID=5)를 생성했습니다. 이 에이전트는 의미 기반 검색을 지원하며, 인터넷에서 결과를 보강할 수 있습니다.

도구	목적	파라미터
Search	의미 기반 + 키워드 검색	max_results=20, search_private=true
Read	토론 게시물 전체 내용 읽기	read_private=true
Researcher	여러 토론 게시물에 대한 심층 분석/합성	max_results=10, LLM=qwen3-VL-8b
WebBrowser	웹 페이지 보기 (인터넷 정보 보강용)	-

각 요청에 대해 포럼 내부에서만 검색 (Search + Read + Researcher)
각 사실은 토론 게시물/포스트 링크로 인용
답변 마지막에 질문: “인터넷에서 정보를 추가로 보강하시겠습니까?”
확인 시 WebBrowser를 사용해 우선순위 있는 사이트를 방문:
- habr.com, meta.discourse.org, stackoverflow.com, github.com
- Kubernetes Documentation | Kubernetes, docs.ansible.com, wiki.archlinux.org
질문 언어로 답변

nomic-embed-text-v1.5 모델은 텍스트를 언어별로 그룹화하며, 의미에 따라 그룹화하지 않습니다. 테스트 결과:

vLLM에 관한 러시아어 텍스트는 vLLM에 관한 영어 텍스트보다 러시아어 레시피 텍스트에 더 가까운 유사도를 보입니다. 이 모델을 사용하면 러시아어 포럼에서 의미 기반 검색이 정확하지 않습니다.

nomic-embed-text-v2-moe 모델로 변경 (MoE, 8x277M, 512 MB Q8_0, 100+ 언어 지원). 결과:

파라미터	값
`ai_embeddings_enabled`	true
`ai_embeddings_selected_model`	12 (nomic-embed-text-v2-moe)
`ai_embeddings_semantic_search_enabled`	true
`ai_embeddings_semantic_search_use_hyde`	true
`ai_embeddings_semantic_search_hyde_agent`	-32 (“콘텐츠 작성자”)
`ai_embeddings_semantic_quick_search_enabled`	true

nomic-embed-text-v2-moe 모델은 LM Studio에서 항상 로드되어야 합니다 (~488 MB VRAM). 모델 변경 후에는 Sidekiq가 자동으로 임베딩을 다시 생성합니다.

Google 검색(완전한 웹 검색)은 사용 불가능합니다. ai_google_custom_search_api_key가 설정되지 않았기 때문입니다. 에이전트는 WebBrowser를 사용해 특정 URL을 방문합니다. 완전한 인터넷 검색을 위해서는:

경로: ~/.lmstudio/server-logs/YYYY-MM/YYYY-MM-DD.N.log

글		댓글	조회수
Self-hosted Discourse AI Sentiment: GPU и CPU варианты AI документация	0	46	3월 30, 2026
AI для разработчика (часть 1, IDE) AI диаграмма	1	47	7월 7, 2025
Руководство к действию в любой ситуации Мысль дня	0	54	7월 6, 2025
Курс обучения чему-либо должен быть интересным Основная	2	88	11월 14, 2025
Токены и стоимость (обучение от Cursor) AI документация	0	58	2월 10, 2026