docs: refresh COMPARISON.md for v0.12 (Neo4j removed, 29 MCP tools)

SonAIengine · claude · SonAIengine · commit 3a79c535231a · 2026-04-13T10:26:16.000+09:00
- Fix storage backend row: Neo4j → SQLite/Kuzu/Postgres/Composite
- MCP tool count: 16 → 29
- Add section 3-6: structured + unstructured data (filter/aggregate/join)
- Expand section 3-4: LLM-free indexing, relation-free graph, BYO embedder
- Update 3-5: OntologyRegistry + DomainProfile TOML two-layer schema
- New section 4: from_data() Easy API, EvidenceSearch 3rd-gen pipeline,
  Phase 1-4 improvements (HNSW 11s→1ms), 9-dataset benchmark table
- Matrix: add LLM-free indexing, BYO embedder, structured tools,
  any-format ingestion rows
- Section 6 repositioning: brain inspiration + universal substrate axes

Co-Authored-By: Claude Opus 4.6 (1M context) &lt;noreply@anthropic.com&gt;
diff --git a/docs/COMPARISON.md b/docs/COMPARISON.md
@@ -1,7 +1,8 @@
 # Synaptic Memory vs. Existing Agent Memory Systems
 
 > 기존 시스템들은 **"저장하고 검색하는 데이터베이스"**에 머물러 있다.
-> Synaptic Memory는 **"경험하고, 학습하고, 잊고, 구조화하는 뇌"**를 지향한다.
+> Synaptic Memory는 **"경험하고, 학습하고, 잊고, 구조화하는 뇌"**이자,
+> **아무 데이터를 넣으면 그래프를 자동 구축해 LLM이 탐색하는 범용 기질**이다.
 
 ---
 
@@ -14,7 +15,7 @@
 > "how to consolidate without catastrophic loss, how to retrieve by cause rather than similarity, how to reflect without entrenching errors, and how to forget safely"
 > — [Memory for Autonomous LLM Agents (2026)](https://arxiv.org/html/2603.07670)
 
-저장과 검색은 발전했지만, **학습, 망각, 구조화**는 아직 미해결이다.
+저장과 검색은 발전했지만, **학습, 망각, 구조화**는 아직 미해결이다. 그리고 하나 더 — 대부분의 시스템이 **"에이전트가 대화하면서 축적한 메모리"** 만 다루고, **임의의 기업 데이터(CSV, PDF, DB 덤프)**를 그래프로 흡수해 같은 검색 파이프라인에서 다루는 통합된 기질(substrate)은 드물다.
 
 ---
 
@@ -31,7 +32,7 @@
 
 ---
 
-## 3. 다섯 가지 구조적 단점
+## 3. 여섯 가지 구조적 단점
 
 ### 3-1. 학습하지 않는다 (No Behavioral Learning)
 
@@ -135,16 +136,16 @@ await graph.agent_search("배포", intent="reasoning_chain")
 # → Decision → Outcome → Lesson multi-hop 순회
 ```
 
-Intent별로 resonance 가중치가 다르다. `past_failures`는 importance(성공률)에 0.35를, `context_explore`는 context(태그 친화도)에 0.40을 준다. 하나의 그래프에서 쿼리 시점에 전략만 바꾸므로 MAGMA 같은 multi-graph 유지 비용이 없다.
+Intent는 `similar_decisions | past_failures | related_rules | reasoning_chain | context_explore | general` 6종. 각각 5축 resonance 가중치(relevance / importance / recency / vitality / context)와 spreading activation 감쇠율이 다르다. `past_failures`는 importance(성공률)에 0.25를, `context_explore`는 spread factor에 0.75를 준다. 하나의 그래프에서 쿼리 시점에 전략만 바꾸므로 MAGMA 같은 multi-graph 유지 비용이 없다.
 
 ---
 
-### 3-4. LLM에 과도하게 의존한다 (LLM-Heavy Operations)
+### 3-4. LLM에 과도하게 의존한다 (LLM-Heavy Indexing & Operations)
 
 메모리의 핵심 연산(추출, 업데이트, 조직화, 충돌 해결)에 LLM을 사용하면 세 가지 문제가 생긴다:
 
-1. **비용**: 메모리 하나 처리에 수천 토큰 소모
-2. **지연**: 실시간 에이전트 루프에서 병목
+1. **비용**: 문서 1개 인덱싱에 수천~수만 토큰 소모
+2. **지연**: 실시간 에이전트 루프에서 병목, 초기 구축에 며칠
 3. **hallucination 전파**: LLM이 잘못 추출한 관계가 메모리에 영구 저장
 
 | 시스템 | LLM 호출 시점 | 대표적 문제 |
@@ -154,24 +155,37 @@ Intent별로 resonance 가중치가 다르다. `past_failures`는 importance(성
 | **Zep/Graphiti** | entity extraction + relation generation + conflict resolution | structured output 필수. 작은 모델에서 [스키마 오류 빈발](https://github.com/getzep/graphiti) |
 | **MAGMA** | causal inference + entity extraction | "susceptible to extraction errors and hallucinations" ([논문](https://arxiv.org/html/2601.03236v1)) |
 | **Letta/MemGPT** | 메모리 관리 자체가 LLM 함수 호출 | context limit 초과 시 요약도 LLM → 이중 비용 |
+| **HippoRAG** | OpenIE triple 추출 (NER + RE) | 인덱싱 시 문서당 수회 LLM 호출, domain tuning 요구 |
 
-#### Synaptic Memory의 접근
+#### Synaptic Memory의 접근 — LLM-free indexing
 
-코어 연산에 LLM 호출이 **0**:
+**인덱싱 단계에서 LLM 호출 0회**가 목표다. v0.12의 EvidenceSearch는 "relation-free graph" 설계로, 엣지를 LLM이 추출한 (s, r, o) 트리플이 아니라 **구조적·통계적 신호**만으로 만든다:
 
 | 연산 | 구현 | LLM 필요 |
 |------|------|---------|
+| Category ↔ Document ↔ Chunk 계층 | 파일 시스템/DB 스키마 그대로 반영 | ✗ |
+| Chunk-next 엣지 | 슬라이딩 윈도우 위치 | ✗ |
+| MENTIONS 엣지 | DF 필터 phrase hub (entity linker) | ✗ |
+| BM25 lexical seed | SQLite FTS5 + Kiwi 형태소(한국어) | ✗ |
+| Vector seed | usearch HNSW (BYO embedder) | ✗ |
+| PRF (Pseudo-Relevance Feedback) | top-k 임베딩 평균 → 2차 검색 | ✗ |
+| PPR graph discovery | Personalized PageRank BFS | ✗ |
+| Hybrid reranking | lexical + semantic + graph + structural + authority + temporal + MaxP | ✗ |
+| Cross-encoder reranker | BYO protocol (TEI bge-reranker-v2-m3 등) | ✗* |
 | Hebbian learning | `weight += 0.1` / `weight -= 0.15` | ✗ |
 | Memory consolidation | access_count, success_rate 기반 규칙 | ✗ |
-| Spreading activation | 이웃 노드 BFS + weight 곱셈 | ✗ |
-| Resonance scoring | 5축 가중합 | ✗ |
 | Ontology validation | 타입 계층 순회 + 속성 검사 | ✗ |
 | Intent-based search | intent별 전략 dispatch + 필터 | ✗ |
 
-LLM은 선택적 확장에서만 사용:
-- `QueryRewriter` — 검색어 재작성 (stage 3 폴백, 결과 부족 시에만)
-- `EmbeddingProvider` — 벡터 임베딩 생성 (벡터 검색 사용 시에만)
-- `Digester` — 구조화 컨텍스트에서 노드/엣지 추출 (consolidation 시 선택적)
+*Cross-encoder는 로컬 모델. LLM API 호출 아님.
+
+LLM이 관여하는 지점은 **사용 시점**뿐이다:
+- 에이전트가 `search` / `deep_search` / `filter_nodes` 등 MCP 도구를 호출
+- LLM이 결과를 읽고 판단·합성
+
+즉, 지식의 **관리**는 규칙 기반이고, 지식의 **사용**만 LLM이 한다. 이 분리가 비용·지연·hallucination 문제를 동시에 해결한다.
+
+또한 임베더/리랭커는 **torch 의존성 0** 원칙으로 BYO(Bring-Your-Own)다. Ollama, TEI, OpenAI API 등 HTTP endpoint만 있으면 주입 가능. 덕분에 `pip install synaptic-memory` 코어가 수 MB에 머무른다.
 
 ---
 
@@ -193,70 +207,185 @@ LLM은 선택적 확장에서만 사용:
 
 #### Synaptic Memory의 접근
 
-OntologyRegistry로 런타임에 타입 시스템을 정의:
+두 가지 레이어의 스키마 시스템을 갖는다.
+
+**(a) OntologyRegistry** — 코드에서 타입 계층을 정의:
 
 ```python
-# 타입 계층
 ontology.register_type(TypeDef(name="knowledge"))
 ontology.register_type(TypeDef(name="decision", parent="knowledge",
     properties=[PropertyDef(name="rationale", required=True)]))
 
-# 관계 제약
 ontology.register_constraint(RelationConstraint(
     edge_kind="resulted_in",
-    domain_types=["decision"],      # source는 decision만
-    range_types=["outcome"],        # target은 outcome만
+    domain_types=["decision"],
+    range_types=["outcome"],
 ))
 
-# 검증
-ontology.validate_node("decision", {})
-# → ["Missing required property 'rationale' for type 'decision'"]
-
 ontology.validate_edge("resulted_in", "concept", "outcome")
 # → ["source type 'concept' not in allowed domains ['decision']"]
 ```
 
-상속도 지원:
+상속도 지원: `technical_decision` 은 `decision` 의 `rationale` 을 자동 상속.
+
+**(b) DomainProfile (TOML)** — 도메인 지식을 코드 바깥에 선언:
+
+```toml
+# profiles/hr.toml
+[ontology]
+entity_types = ["employee", "department", "project"]
+ontology_hints = { employee_id = "employee", dept_code = "department" }
+
+[lexical]
+stopwords = ["주식회사", "님"]
+synonyms = { "퇴사" = ["이직", "퇴직"], "월급" = ["급여", "연봉"] }
+
+[ingestion]
+chunk_size = 512
+chunk_overlap = 64
+```
+
+`from_data("./hr_data/", profile="profiles/hr.toml")` 한 줄이면 위 설정이 인덱싱·검색 전체 파이프라인에 적용된다. 같은 라이브러리로 법률·의료·전자상거래 도메인을 각각 TOML 한 장으로 전환. Profile은 `profile_generator` 3-tier(rule → classifier → LLM)로 자동 생성도 가능.
+
+이로써 "코어 코드에 도메인 종속 로직을 두지 않는다"는 원칙이 실제로 작동한다.
+
+---
+
+### 3-6. 비정형 + 정형 데이터를 함께 다루지 못한다 (Document-only or KV-only)
+
+대부분의 에이전트 메모리는 **텍스트 문서** 또는 **대화 히스토리**만 받는다. 하지만 실제 기업에서 가장 중요한 지식은:
+- **비정형**: 정책 문서, 매뉴얼, 회의록, PDF, 마크다운
+- **정형**: 제품 DB, 직원 테이블, 주문 이력, 스펙 시트, CSV/Parquet
+
+두 종류가 **하나의 그래프** 안에 섞여 있어야 "이 직원이 담당한 프로젝트와 관련된 회의록은?" 같은 질의가 가능하다.
+
+**HippoRAG / Mem0 / A-MEM / MAGMA**: 텍스트만 다룬다. 테이블 행을 넣으려면 사용자가 직접 자연어로 변환해야 한다.
+**Zep**: 에피소드 = 대화 메시지. 기업 DB ingestion 경로 없음.
+**Letta/MemGPT**: core/archival 전부 텍스트 블록.
+
+#### Synaptic Memory의 접근
+
+`TableIngester` + `DBIngester` 가 CSV/Parquet/PostgreSQL 테이블을 **typed property 노드**로 전환한다. 각 행은 ontology type 을 갖는 노드가 되고, 외래키는 그래프 엣지가 된다. 그리고 3개의 정형 전용 MCP 도구가 LLM에 노출된다:
+
+```python
+# filter_nodes — WHERE 절 대체
+filter_nodes(node_type="order", conditions={"status": "shipped", "total_gte": 100})
+
+# aggregate_nodes — GROUP BY 대체
+aggregate_nodes(node_type="order", group_by="customer_id",
+                agg="sum", field="total")
+
+# join_related — JOIN 대체
+join_related(from_type="customer", to_type="order",
+             via_edge="placed", to_conditions={"status": "pending"})
+```
+
+같은 `SynapticGraph` 인스턴스 안에서 문서 FTS 검색과 테이블 필터·집계·조인이 공존한다. 에이전트는 intent에 따라 도구를 선택만 하면 된다. 이는 v0.12에서 도입된 차별화 포인트로, 다른 6개 시스템 어느 것도 같은 그래프에서 제공하지 않는다.
+
+---
+
+## 4. v0.12 — Easy API와 벤치마크
+
+### 4-1. `from_data()` — 2줄로 시작
 
 ```python
-ontology.register_type(TypeDef(name="technical_decision", parent="decision",
-    properties=[PropertyDef(name="tech_stack")]))
+from synaptic import SynapticGraph
+
+graph = await SynapticGraph.from_data("./my_data/")   # CSV/JSONL/PDF/MD 자동 감지
+result = await graph.search("내 질문")
+```
+
+내부적으로는:
+1. 파일 형식 감지 (`.csv` → TableIngester, `.pdf/.md/.txt` → DocumentIngester, DB URL → DBIngester)
+2. 자동 DomainProfile 생성 (rule → classifier → optional LLM)
+3. Category → Document → Chunk 계층 생성 + MENTIONS 엣지
+4. BM25 인덱스(FTS5 + Kiwi) 및 HNSW 벡터 인덱스 구축
+5. 검색 준비 완료
+
+코어 의존성은 여전히 **0개**다. 백엔드·임베더·한국어 분석은 전부 optional extras (`pip install synaptic-memory[sqlite,korean,vector,embedding]`).
 
-ontology.infer_properties("technical_decision")
-# → [rationale (required, from decision), tech_stack (from self)]
+### 4-2. EvidenceSearch 3세대 파이프라인
+
+```
+Step 0: 쿼리 임베딩 (BYO embedder)
+Step 1: QueryAnchorExtractor (카테고리/엔티티/키워드)
+Step 2a: FTS seed — BM25 + Kiwi 형태소 + title 3x boost
+Step 2b: Vector seed — usearch HNSW, cascade
+Step 2c: Vector PRF — top-3 임베딩 평균 → 2차 검색
+Step 3:  GraphExpander — 1-hop (category siblings, chunk-next, MENTIONS)
+Step 3b: PPR graph discovery
+Step 4:  HybridReranker — lexical + semantic + graph + structural + authority + temporal + MaxP
+Step 4b: Cross-encoder reranker (BYO, TEI/Ollama)
+Step 5:  EvidenceAggregator — MMR + per-doc cap + category coverage
 ```
 
+v0.11 대비 알고리즘 개선:
+- **Phase 1** (MaxP document aggregation + Vector PRF): Hard-set MRR +21%
+- **Phase 2** (usearch HNSW): 벡터 검색 레이턴시 **11,000ms → 1ms (100×)**
+- **Phase 3** (Cross-encoder bge-reranker-v2-m3): Hard-set MRR +22%
+- **Phase 4** (PPR graph discovery): 크로스 문서 hit rate +15%
+- **Kiwi 형태소**: 한국어 조사 분리 (한글 비율 50%+ 자동 감지)
+
+### 4-3. 벤치마크
+
+9개 데이터셋 자동 평가 (`uv run python eval/run_all.py`). v0.12 기준:
+
+| 데이터셋 | 언어 | Corpus | MRR | Hit | 비고 |
+|---------|------|--------|:---:|:---:|------|
+| KRRA Easy (20q) | KO | 19,720 | **0.975** | 20/20 | FTS + Kiwi + embed |
+| KRRA Hard (15q) | KO | 19,720 | **0.933** | 15/15 | + embed + cross-encoder |
+| KRRA Hard Multi-turn | KO | 19,720 | — | 12/15 (80%) | GPT-4o-mini agent |
+| assort Easy (15q) | KO | 13,909 | **0.889** | 14/15 | 정형 CSV |
+| HotPotQA-24 | EN | 226 | **0.727** | 24/24 | multi-hop |
+| Allganize RAG-ko | KO | 200 | **0.621** | 180/200 | 기업 문서 |
+| Allganize RAG-Eval | KO | 300 | **0.615** | 264/300 | 금융/의료/법률 |
+| AutoRAG | KO | 720 | **0.592** | 98/114 | 기업 검색 |
+| X2BEE Easy (20q) | EN | 19,843 | **1.000** | 20/20 | DB→온톨로지 (FTS) |
+| X2BEE Hard Multi-turn | EN/KO | 19,843 | — | 8/19 (42%) | structured tools agent |
+
+모든 수치는 **로컬 실행** 기준. 인덱싱 단계 LLM 호출 0회. 벤치마크 실행 자체에 드는 API 비용은 multi-turn agent 평가에 쓰이는 GPT-4o-mini 호출뿐이다.
+
 ---
 
-## 4. 종합 비교 매트릭스
+## 5. 종합 비교 매트릭스
 
 | 능력 | HippoRAG | Zep | Mem0 | A-MEM | MAGMA | Letta | **Synaptic** |
 |------|:--------:|:---:|:----:|:-----:|:-----:|:-----:|:------------:|
-| Spreading Activation | ✅ PPR | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ BFS+weight |
+| Spreading Activation | ✅ PPR | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ PPR + BFS+weight |
 | Behavioral Learning | ✗ | ✗ | △ LLM | △ LLM | △ LLM | ✗ | ✅ Hebbian |
 | Memory Consolidation | ✗ | △ temporal | △ LRU | ✗ | ✗ | △ summarize | ✅ L0→L3 |
 | Principled Forgetting | ✗ | △ invalidate | ✗ | ✗ | ✗ | ✗ | ✅ TTL+decay |
 | Intent-based Search | ✗ | ✗ | ✗ | ✗ | △ partial | ✗ | ✅ 6 intents |
-| Ontology/Schema | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ TypeDef |
+| Ontology / Schema | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ TypeDef + DomainProfile |
 | Agent Activity Tracking | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ integrated |
-| LLM-free Core | ✗ NER필수 | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ zero-LLM |
-| Graph DB Native | ✗ | ✅ Neo4j | ✗ | ✗ | ✗ | ✗ | ✅ Neo4j |
-| MCP Integration | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ 16 tools |
+| **LLM-free Indexing** | ✗ OpenIE | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ relation-free |
+| **BYO Embedder/Reranker** (torch-free) | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ HTTP protocol |
+| **Structured Data Tools** (filter/aggregate/join) | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ 3 tools |
+| **Any-format Ingestion** (CSV/PDF/DB/JSONL) | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ `from_data()` |
+| Storage Backend | in-mem | Neo4j | vector store | vector store | vector store | PG + files | SQLite/Kuzu/Postgres/Composite |
+| MCP Integration | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✅ **29 tools** |
 
 **✅** = 완전 지원 / **△** = 부분 지원 또는 제한적 / **✗** = 미지원
 
 ---
 
-## 5. 포지셔닝
+## 6. 포지셔닝
 
-Synaptic Memory는 기존 연구의 개별 아이디어를 조합한 것이 아니라, **뇌의 작동 원리를 일관되게 적용한 통합 시스템**이다:
+Synaptic Memory는 기존 연구의 개별 아이디어를 조합한 것이 아니라, **뇌의 작동 원리**와 **범용 검색 기질** 이라는 두 축을 일관되게 적용한 통합 시스템이다.
 
+**뇌 쪽 영감:**
 - **HippoRAG**에서 spreading activation의 가치를 확인했지만, "읽기 전용"이라는 한계를 넘어 **쓰기(활동 기록) + 학습(Hebbian) + 망각(consolidation)**을 추가
 - **Zep**에서 temporal KG의 가치를 확인했지만, 시간만 추적하는 한계를 넘어 **사용 패턴(access_count, success_rate) 기반 생명주기**를 구현
 - **MAGMA**에서 intent-aware retrieval의 가치를 확인했지만, 4개 그래프 유지 비용을 회피하고 **하나의 그래프에서 intent별 전략 전환**으로 해결
-- **시맨틱 웹**에서 온톨로지의 가치를 가져왔지만, OWL/RDF의 복잡도를 피하고 **Python dataclass + Protocol 기반 경량 타입 시스템**으로 구현
+- **시맨틱 웹**에서 온톨로지의 가치를 가져왔지만, OWL/RDF의 복잡도를 피하고 **Python dataclass + TOML DomainProfile 기반 경량 타입 시스템**으로 구현
+
+**범용 기질 쪽:**
+- **GraphRAG 계열**이 문서 인덱싱에 LLM을 필수로 쓰는 것을 회피하고, BM25 + HNSW + MENTIONS phrase hub 로 **LLM-free indexing** 을 달성
+- **정형 + 비정형**을 같은 그래프에 올려서, 문서 검색과 SQL-like 연산을 같은 에이전트가 자연스럽게 사용할 수 있게 함
+- **BYO embedder/reranker** 로 torch 의존성을 제거, 코어를 가볍게 유지하면서도 Ollama·TEI·API 등 사용자가 고른 런타임을 그대로 쓰게 함
+- **`from_data()` 2줄** 로 진입 장벽을 낮추고, 복잡한 튜닝은 DomainProfile TOML 로 옵트인
 
-핵심 차별점은 **LLM 의존도**: 기존 시스템들이 메모리의 핵심 연산(추출, 업데이트, 조직화)에 LLM을 필수로 사용하는 반면, Synaptic Memory는 코어가 순수 Python이다. LLM은 에이전트가 지식을 **사용**하는 시점에만 관여하고, 지식의 **관리**(학습, 정리, 검증)는 규칙 기반으로 작동한다.
+핵심 차별점은 **LLM 의존도**다. 기존 시스템들이 메모리의 핵심 연산(추출, 업데이트, 조직화)에 LLM을 필수로 사용하는 반면, Synaptic Memory는 **인덱싱에 LLM 비용 0원** 이다. LLM은 에이전트가 지식을 **사용**하는 시점(검색 결과 해석, 도구 호출, 답변 합성)에만 관여하고, 지식의 **관리**(학습, 정리, 검증, 인덱싱)는 규칙·통계 기반으로 작동한다.
 
 ---