Create Knowledge DB (지식 DB 생성) 노드는 Retrieval Augmented Generation (RAG, 검색증강생성) 시스템을 위한 다양한 지식데이터베이스 유형의 생성 및 구성을 가능하게 합니다. 벡터 데이터베이스, 문서 데이터베이스, 하이브리드 솔루션을 포함한 여러 데이터베이스 서비스를 지원하며, 구성 가능한 인덱싱과 유사성 검색 옵션을 제공합니다.
이 노드는 RAG 시스템의 기반이 되는 지식 데이터베이스지식 데이터베이스 를 생성 및 구성합니다. 선택한 데이터베이스 서비스에 따라 입력된 임베딩 또는 세그먼트를 처리하고, 적합한 인덱스를 생성하며, 검색 작업에 사용할 준비가 된 구성된 지식 데이터베이스를 출력합니다.
생성된 지식 DB에 고유한 태그를 할당하는 것을 강력히 권장합니다. 태깅을 통해 다른 플로우 그래프에서 Knowledge DB select 또는 Knowledge DB search 노드를 통해 원하는 지식 DB를 쉽게 선택할 수 있습니다.
Table of Contents
| Property | 설명 | 필수 |
|---|---|---|
Database Service |
HyperFlow에서 제공하는 지식 데이터베이스 서비스 (FAISS, Pinecone, ElasticSearch, MongoDB) | O |
Tags |
데이터베이스를 위한 태그 | X |
Notes |
추가 컨텍스트를 제공하는 텍스트 | X |
FAISS(Facebook AI Similarity Search)는 밀집 벡터의 효율적인 유사성 검색 및 클러스터링을 위해 최적화된 인메모리 벡터 데이터베이스입니다. 작은 벡터 데이터베이스에 적합하여, 대규모 벡터 데이터베이스의 경우 메모리 로딩 지연으로 인해 검색 속도가 느려질 수 있습니다. FAISS 벡터 데이터베이스는 HyperFlow에 내장된 서비스입니다.
| Parameter | 설명 |
|---|---|
Index Type |
"Inverted index" 또는 "HNSW" 중 선택 |
Similarity Metric |
"Euclidian distance", "Inner product", 또는 "Cosine" |
Quantization |
"Product quantization" 또는 "None" |
Number of index cells |
Number of cells for Inverted index (기본값: 30) |
Neighborhood density |
HNSW parameter for graph connectivity (기본값: 16) |
Construction effort |
HNSW parameter for build quality (기본값: 200) |
ElasticSearch는 벡터 검색 기능과 강력한 텍스트 검색 기능을 결합한 분산 검색 및 분석 엔진입니다. 이는 의미 기반과 키워드 기반 접근 방식을 결합한 하이브리드 검색을 지원합니다. 현재 ElasticSearch 서비스는 Elastic Cloud에서 호스팅됩니다.
| Parameter | 설명 |
|---|---|
HNSW Indexing |
HNSW 인덱싱 기능을 활성화/비활성화 |
Similarity Metric |
"Cosine", "Dot product", 또는 "Euclidian distance" |
Quantization |
"int8_hnsw" 또는 "int4_hnsw" |
MongoDB 벡터 데이터베이스는 MongoDB 문서 데이터베이스에 직접 통합된 벡터 검색 기능을 제공합니다. 이는 벡터 검색을 위한 직관적인 접근 방식을 제공합니다. MongoDB 벡터 DB는 내장된 HyperFlow 서비스로, 대규모 벡터 데이터베이스에 가장 적합한 내장 벡터 데이터베이스로 추천됩니다.
| --- | --- |
| --- | --- | --- |
| --- | --- | --- |