Engram / Memory-native coding runtime

PRD를 죽은 문서가 아니라 실행 중인 기억으로 바꿉니다.

Engram은 기억, 검증, 로컬 실행, 워크플로 보고를 하나의 실행 경계로 묶는 memory-native coding runtime입니다. Code Map, Living PRD, Nexus(Agent Memory), AMCP 호환 연결을 통해 코딩에이전트가 프로젝트의 과거와 현재, 그리고 사용자의 작업 방식을 함께 보게 합니다.

설치 방법 보기 Nunchi Memory 보기

Living PRD

PRD는 한 번 쓰고 잊히는 파일이 아니라, 코드와 함께 갱신되는 작업 기억이어야 합니다.

일반 PRD

초기 의도 파일로 멈춥니다.

• 처음에는 열심히 씁니다.
• 구현이 시작되면 코드와 점점 어긋납니다.
• 결국 아무도 안 보는 “초기 의도 파일”이 됩니다.

Engram Living PRD

구현 중인 기억으로 남습니다.

• 코드 변경, 결정, 검증 결과를 계속 반영합니다.
• PRD와 실제 구현의 차이를 감지합니다.
• 다음 작업 때 “원래 의도”, “현재 구현”, “바뀐 결정”을 같이 불러옵니다.
• Nexus(Agent Memory)에 남은 결정/검증 기억과 연결됩니다.

Why teams use Engram

코딩에이전트가 코드를 바꾸기 전에, 프로젝트의 기억을 먼저 읽습니다.

중복 구현 방지

다른 팀원이 만든 기능을 또 만들고 있을 때

Engram은 Code Map과 Nexus(Agent Memory)를 함께 확인해 이미 존재하는 함수, 최근 결정, 검증 결과를 작업 전에 불러옵니다. 같은 기능을 다시 만드는 시간을 줄이고, 기존 구현을 확장하는 방향으로 작업을 돌립니다.

Living PRD

PRD와 코드가 서로 다른 말을 할 때

Living PRD가 “문서의 의도”와 “현재 구현” 사이의 차이를 드러냅니다. 오래된 PRD를 그대로 믿지 않고, 실제 코드와 최근 결정까지 포함해 다음 패치를 판단합니다.

Task Intake

요청이 애매한데 바로 코드를 바꾸려 할 때

Task Intake Compiler가 실행 전에 멈춥니다. 필요한 질문을 먼저 하고, 확인된 TaskSpec만 실행하므로 잘못된 전제에서 긴 작업을 시작하지 않습니다.

Model handoff

모델을 바꿔도 프로젝트 맥락이 이어져야 할 때

Anthropic, OpenAI-compatible, Ollama, OpenRouter/Groq/DeepInfra 계열을 profile로 바꿔도 세션, 결정, 검증 기억을 이어받습니다. 모델은 바뀌어도 작업의 기억은 남습니다.

User memory

매번 같은 설명을 반복하고 있을 때

Engram은 사용자가 선호하는 작업 방식, 자주 쓰는 검증 루틴, 싫어하는 코드 스타일, 반복되는 결정 기준을 Nexus(Agent Memory)에 남깁니다. 시간이 지날수록 “이 사람은 보통 이렇게 일한다”는 맥락을 먼저 불러와 더 적은 설명으로 더 맞는 작업을 시작합니다.

Circuit recovery

장애 대응을 Slack에서 끝까지 밀어야 할 때

Circuit에서는 Slack 지시가 Conductor와 local worker를 거쳐 Engram 실행으로 이어집니다. Engram은 수정, 검증, 실패 원인, recovery hint를 구조화해 PR 또는 복구 리포트로 돌려줍니다.

Token-saving benchmark

로컬 모델에서도 토큰을 줄이고 답변 품질은 동일하거나 약간 우수했습니다.

NCM-001은 단일 시나리오 내부 벤치마크입니다. 그래도 중요한 신호가 있습니다. `qwen-local`은 로컬 Ollama 환경에서 Engram packing을 적용했을 때 토큰을 46.91% 줄이면서 평균 점수는 3.97에서 4.10으로 올랐고, 성공 수는 24/30에서 25/30으로 개선됐습니다. Personal Local에서 로컬 모델을 쓰기 좋은 근거입니다.

Total tokens

168,044 → 91,102

-45.79%

Avg score

4.29 → 4.39

+0.10

Success

103/120 → 106/120

Model route	Type	Mode	Tokens	Success	Avg score	Regressions	Reduction
openai-4o-mini	API	raw	37,219	23/30	3.97	0	-
openai-4o-mini	API	engram	17,607	24/30	4.07	0	52.69%
qwen-local	Local / Ollama	raw	37,873	24/30	3.97	0	-
qwen-local	Local / Ollama	engram	20,105	25/30	4.10	0	46.91%
glm	API	raw	37,998	29/30	4.73	0	-
glm	API	engram	18,547	29/30	4.73	0	51.19%
minimax	API	raw	54,954	27/30	4.50	1	-
minimax	API	engram	34,843	28/30	4.67	0	36.60%

Internal NCM-001, 2026-04-28. V2-reproducible record 기준입니다. 공정성을 위해 1차 평가는 `codex-auth/gpt-5.5`, 교차 평가는 `claude-opus-4-7`을 사용했습니다. Cross-judge pilot에서는 `goal_achieved` 27/30, `decision_violations` 24/30, `regression_violation` 30/30이 일치했고, 점수는 30/30 모두 1점 이내였습니다.

Saved tokens

76,942

NCM-001 한 번의 비교에서 줄어든 총 토큰입니다. 비용은 이 숫자에 모델의 1M input token 단가를 곱해 계산합니다.

Model route	Saved tokens	Input $ / 1M	Saved / run	Saved / 1,000 runs
openai-4o-mini	19,612	$0.15	$0.0029	$2.94
qwen-local	17,768	local	$0 API	$0 API
glm-4.7	19,451	$0.60	$0.0117	$11.67
minimax-m2.5	20,111	$0.118	$0.0024	$2.37

단가는 공개 input-token 가격을 기준으로 한 예시입니다. output token, 캐시 할인, provider별 계약가, 로컬 전기/하드웨어 비용은 제외했습니다. 로컬 `qwen-local`은 API 비용 절감보다 “네트워크/API 비용 없이 로컬에서 쓸 수 있음”이 핵심입니다.

Runtime surface

Engram은 코딩 세션의 실행 경계를 소유합니다.

Code Map은 현재 lightweight/heuristic 기반입니다. 원본 코드 전체를 외부 기억에 저장하지 않고, repo manifest, 영향 범위, call-flow, 검증 결과, recovery report 같은 durable event만 남기는 방향을 따릅니다.

기억을 가진 코딩 세션

매번 처음부터 설명하지 않고 세션, Agent Memory, Axon/Nexus 기억을 불러옵니다.

사용자에게 맞춰지는 실행

작업 방식, 선호, 검증 습관, 결정 기준을 기억해 다음 세션의 기본 맥락으로 사용합니다.

터미널-first REPL

`engram`으로 시작하고 `/status`, `/memory`, `/trace`, `/circuit`로 상태를 확인합니다.

검증 중심 실행

verification plan/report, closeout, recovery hint를 남겨 작업의 끝을 기록합니다.

Raw-code-free memory

원본 코드는 로컬 repo에서 fresh read하고, Agent Memory에는 요약 이벤트와 결정만 남깁니다.

AMCP-compatible

Engram의 기억은 한 도구 안에 갇히지 않습니다.

Engram은 AMCP 표준을 따르는 기억 구조를 사용합니다. 그래서 Nexus(Agent Memory), Norfolk(Human Memory), MaaS, MCP 도구와 연결될 수 있고, Codex, Claude Code, Cursor 같은 다른 코딩에이전트도 필요한 기억을 recall하는 방식으로 같은 프로젝트 맥락에 접근할 수 있습니다.

AMCP 보기 Nexus 보기