일반 PRD
초기 의도 파일로 멈춥니다.
- • 처음에는 열심히 씁니다.
- • 구현이 시작되면 코드와 점점 어긋납니다.
- • 결국 아무도 안 보는 “초기 의도 파일”이 됩니다.
Engram / Memory-native coding runtime
Engram은 기억, 검증, 로컬 실행, 워크플로 보고를 하나의 실행 경계로 묶는 memory-native coding runtime입니다. Code Map, Living PRD, Nexus(Agent Memory), AMCP 호환 연결을 통해 코딩에이전트가 프로젝트의 과거와 현재, 그리고 사용자의 작업 방식을 함께 보게 합니다.

Living PRD
일반 PRD
Engram Living PRD
Why teams use Engram
중복 구현 방지
Engram은 Code Map과 Nexus(Agent Memory)를 함께 확인해 이미 존재하는 함수, 최근 결정, 검증 결과를 작업 전에 불러옵니다. 같은 기능을 다시 만드는 시간을 줄이고, 기존 구현을 확장하는 방향으로 작업을 돌립니다.
Living PRD
Living PRD가 “문서의 의도”와 “현재 구현” 사이의 차이를 드러냅니다. 오래된 PRD를 그대로 믿지 않고, 실제 코드와 최근 결정까지 포함해 다음 패치를 판단합니다.
Task Intake
Task Intake Compiler가 실행 전에 멈춥니다. 필요한 질문을 먼저 하고, 확인된 TaskSpec만 실행하므로 잘못된 전제에서 긴 작업을 시작하지 않습니다.
Model handoff
Anthropic, OpenAI-compatible, Ollama, OpenRouter/Groq/DeepInfra 계열을 profile로 바꿔도 세션, 결정, 검증 기억을 이어받습니다. 모델은 바뀌어도 작업의 기억은 남습니다.
User memory
Engram은 사용자가 선호하는 작업 방식, 자주 쓰는 검증 루틴, 싫어하는 코드 스타일, 반복되는 결정 기준을 Nexus(Agent Memory)에 남깁니다. 시간이 지날수록 “이 사람은 보통 이렇게 일한다”는 맥락을 먼저 불러와 더 적은 설명으로 더 맞는 작업을 시작합니다.
Circuit recovery
Circuit에서는 Slack 지시가 Conductor와 local worker를 거쳐 Engram 실행으로 이어집니다. Engram은 수정, 검증, 실패 원인, recovery hint를 구조화해 PR 또는 복구 리포트로 돌려줍니다.
Token-saving benchmark
NCM-001은 단일 시나리오 내부 벤치마크입니다. 그래도 중요한 신호가 있습니다. `qwen-local`은 로컬 Ollama 환경에서 Engram packing을 적용했을 때 토큰을 46.91% 줄이면서 평균 점수는 3.97에서 4.10으로 올랐고, 성공 수는 24/30에서 25/30으로 개선됐습니다. Personal Local에서 로컬 모델을 쓰기 좋은 근거입니다.
Total tokens
168,044 → 91,102
-45.79%
Avg score
4.29 → 4.39
+0.10
Success
103/120 → 106/120
+3
| Model route | Type | Mode | Tokens | Success | Avg score | Regressions | Reduction |
|---|---|---|---|---|---|---|---|
| openai-4o-mini | API | raw | 37,219 | 23/30 | 3.97 | 0 | - |
| openai-4o-mini | API | engram | 17,607 | 24/30 | 4.07 | 0 | 52.69% |
| qwen-local | Local / Ollama | raw | 37,873 | 24/30 | 3.97 | 0 | - |
| qwen-local | Local / Ollama | engram | 20,105 | 25/30 | 4.10 | 0 | 46.91% |
| glm | API | raw | 37,998 | 29/30 | 4.73 | 0 | - |
| glm | API | engram | 18,547 | 29/30 | 4.73 | 0 | 51.19% |
| minimax | API | raw | 54,954 | 27/30 | 4.50 | 1 | - |
| minimax | API | engram | 34,843 | 28/30 | 4.67 | 0 | 36.60% |
Internal NCM-001, 2026-04-28. V2-reproducible record 기준입니다. 공정성을 위해 1차 평가는 `codex-auth/gpt-5.5`, 교차 평가는 `claude-opus-4-7`을 사용했습니다. Cross-judge pilot에서는 `goal_achieved` 27/30, `decision_violations` 24/30, `regression_violation` 30/30이 일치했고, 점수는 30/30 모두 1점 이내였습니다.
Saved tokens
76,942
NCM-001 한 번의 비교에서 줄어든 총 토큰입니다. 비용은 이 숫자에 모델의 1M input token 단가를 곱해 계산합니다.
| Model route | Saved tokens | Input $ / 1M | Saved / run | Saved / 1,000 runs |
|---|---|---|---|---|
| openai-4o-mini | 19,612 | $0.15 | $0.0029 | $2.94 |
| qwen-local | 17,768 | local | $0 API | $0 API |
| glm-4.7 | 19,451 | $0.60 | $0.0117 | $11.67 |
| minimax-m2.5 | 20,111 | $0.118 | $0.0024 | $2.37 |
단가는 공개 input-token 가격을 기준으로 한 예시입니다. output token, 캐시 할인, provider별 계약가, 로컬 전기/하드웨어 비용은 제외했습니다. 로컬 `qwen-local`은 API 비용 절감보다 “네트워크/API 비용 없이 로컬에서 쓸 수 있음”이 핵심입니다.
Runtime surface
Code Map은 현재 lightweight/heuristic 기반입니다. 원본 코드 전체를 외부 기억에 저장하지 않고, repo manifest, 영향 범위, call-flow, 검증 결과, recovery report 같은 durable event만 남기는 방향을 따릅니다.
매번 처음부터 설명하지 않고 세션, Agent Memory, Axon/Nexus 기억을 불러옵니다.
작업 방식, 선호, 검증 습관, 결정 기준을 기억해 다음 세션의 기본 맥락으로 사용합니다.
`engram`으로 시작하고 `/status`, `/memory`, `/trace`, `/circuit`로 상태를 확인합니다.
verification plan/report, closeout, recovery hint를 남겨 작업의 끝을 기록합니다.
원본 코드는 로컬 repo에서 fresh read하고, Agent Memory에는 요약 이벤트와 결정만 남깁니다.