드러켄밀러가 LLM을 쓴다면 — 단일 관점에서 던지는 질문은 답의 90%를 버린다
그가 본 것
스탠리 드러켄밀러는 매크로 투자자다. 그의 트랙 레코드는 30년간 연평균 30% 수익률을 한 번도 손실 없이 유지한 거의 유일한 기록이다. 어떤 한 분야의 깊은 전문성으로 설명되지 않는 숫자다.
본인은 비밀을 이렇게 말했다 — 여러 섹터의 여러 회사 발표를 다양하게 접하다 보니, 그 중 어느 누구도 보지 못하는 다른 지점을 예측할 수 있게 되었다.
반도체 회사 CEO는 "재고가 쌓이고 있다"고 한다. 같은 분기 자동차 회사 CFO는 "칩 부족이 해소되고 있다"고 한다. 둘 다 자기 섹터에서는 정확하다. 하지만 둘을 동시에 듣는 사람만이 듣게 되는 다른 문장이 있다 — 수요 둔화가 시작됐다.
이 문장은 어느 회사의 발표에도 등장하지 않는다. 두 발표 사이의 빈 공간에만 존재한다.
빈 공간이라는 자산
지난 글에서 우리는 LLM의 창발이 규모가 아니라 언어 다양성의 산물이라고 주장했다. 서로 다른 언어가 한 공간에서 교차할 때, 어느 언어에도 단독으로 존재하지 않는 새 표상이 출현한다는 가설이었다.
그 가설을 한 단계 더 끌어올리면 이렇게 된다 — 언어는 결국 한 공동체가 자기 환경에서 살아남으며 압축한 도메인 지식이다. 이누이트어의 30개 눈 어휘는 극지 생존이라는 도메인의 압축이다. 한국어의 "눈치"는 위계 사회 상호작용이라는 도메인의 압축이다. 그렇다면 더 일반적인 명제가 가능하다.
도메인 간 교차에서 새 표상이 출현한다.
다윈은 박물학과 지질학과 인구학(맬서스)의 교차에서 자연선택을 봤다. 어느 한 분야에 머물렀어도 못 봤을 결론이다. 섀넌은 부울 대수와 전기 회로와 통계역학의 교차에서 정보이론을 만들었다. 카너먼은 심리학과 경제학의 교차에서 행동경제학을 세웠다. 찰리 멍거가 평생 강조한 "lattice of mental models"가 정확히 이 가설이다 — 여러 학문의 모델을 격자로 엮어야 어느 한 모델만 가진 사람이 못 보는 걸 본다.
드러켄밀러도 같은 가설의 살아있는 증명이다. 그가 본 것은 새로운 데이터가 아니라 데이터들 사이의 빈 공간이었다.
LLM이 자동으로 드러켄밀러가 되지 않는 이유
여기서 흥미로운 역설이 등장한다. LLM은 인류 역사상 처음으로 모든 도메인의 텍스트를 동시에 한 공간에 압축한 존재다. 도메인 다양성이 이미 극대화되어 있다. 그렇다면 자동으로 드러켄밀러처럼 통찰을 내놓아야 하지 않나?
그렇지 않다. 왜냐하면 사용자의 질문이 단일 도메인 답변을 요구하는 형태로 들어오면, 모델은 가장 흔한 단일 도메인 답변으로 회귀하기 때문이다.
"이 시장 어떻게 보세요?"라고 물으면 가장 일반적인 시장 분석이 나온다. "이 코드 어떻게 고치죠?"라고 물으면 가장 흔한 코드 수정이 나온다. 도메인 교차 능력은 모델 안에 잠재해 있지만, 질문이 그 교차를 호출하지 않으면 활성화되지 않는다.
프롬프트 엔지니어링의 본질은 결국 이것이다 — 모델 안에 잠들어 있는 도메인 교차를 깨우는 트리거를 설계하는 일.
잠든 교차를 깨우는 네 가지 방법
1. 시점을 미래로 옮긴다 — Pre-mortem
가장 강력하면서도 거의 알려지지 않은 기법이다.
"이 계획의 단점이 뭘까?"라고 물으면 모델은 일반적인 위험 목록을 나열한다. 이걸 다음과 같이 바꿔보라.
"이 계획이 18개월 후 처참히 실패했다고 가정하자. 그 실패의 가장 그럴듯한 시나리오 3개를, 미래에서 현재로 역추적해서 들려줘."
같은 사실을 보지만 시점이 바뀌면 보이는 것이 달라진다. 현재 시점의 위험 목록은 추상적이다. 미래에서 회고하는 실패 서사는 구체적인 인과관계를 강제한다. 어떤 결정이 어떤 결과를 낳고 그것이 어떤 도미노를 일으켰는가 — 미래 시점은 현재 시점에서 보이지 않는 연쇄의 빈 공간을 채운다.
2. 적을 직접 만든다 — Steel-manning
자기 가설의 약점을 점검할 때 우리가 흔히 하는 실수는 "단점을 알려줘"라고 묻는 것이다. 모델은 흔한 단점 목록으로 답한다.
대신 이렇게 묻는다.
"내 가설을 가장 강하게 반박하는 비판자가 있다고 가정하자. 그 비판자가 내 약점을 정확히 짚으면서 펼칠 수 있는 가장 날카로운 반박을 써줘."
"가장 똑똑한 반대자"라는 페르소나가 들어가는 순간 모델은 비판의 깊이를 다른 차원으로 끌어올린다. 우리 자신은 자기 가설의 진짜 약점을 보지 못한다. 약점을 보는 것이 곧 가설을 버려야 함을 의미하기 때문이다. 그러나 외부 비판자의 입을 빌리면 그 인지적 저항이 사라진다. 우리가 차마 직시하지 못하던 진공이 드러난다.
3. 문제의 정의를 바꾼다 — Frame shifting
같은 문제를 다른 학문 렌즈로 다시 정의하는 기법이다.
스타트업이 사용자 이탈 문제를 풀고 있다고 하자. 보통은 이렇게 묻는다 — "이탈률을 어떻게 줄이지?" 모델은 일반적인 리텐션 전략을 나열한다.
이걸 이렇게 바꾼다.
"사용자 이탈을 다음 네 가지 렌즈로 각각 재정의해줘. (a) 기술 문제로 본다면, (b) 신뢰 문제로 본다면, (c) 정체성 문제로 본다면, (d) 미학 문제로 본다면."
같은 현상이 네 개의 다른 문제로 변신한다. 그리고 결정적으로 — 해법 공간 전체가 바뀐다. 기술 문제에는 코드가 답이고, 신뢰 문제에는 커뮤니케이션이 답이며, 정체성 문제에는 브랜드가 답이고, 미학 문제에는 감각이 답이다. 어느 정의가 옳은가가 핵심이 아니다. 정의를 바꿔보지 않으면 보이지 않는 해법이 있다는 것이 핵심이다.
4. 거꾸로 본다 — Inversion
찰리 멍거가 평생 가장 자주 인용한 기법이다. 멍거는 이렇게 말했다 — "Invert. Always invert."
성공하는 법을 묻는 대신 망하는 법을 묻는다.
"이 사업을 가장 확실하게 망하게 하는 법을 설계해줘."
이상한 질문 같지만 효과가 정직하다. 우리는 성공의 경로를 무한히 상상할 수 있지만 그 중 어떤 것이 실제로 작동할지는 모른다. 반면 어떤 행동이 거의 확실하게 실패를 부르는가는 훨씬 명확하게 답할 수 있다. 그리고 그 실패 행동들의 부정형이 곧 해야 할 일의 윤곽이 된다.
이건 단순한 농담이 아니라 인지적 비대칭의 활용이다. 부정의 경로는 긍정의 경로보다 압축이 잘 된다.
질문은 곧 사고의 격자
이 네 가지 기법의 공통점은 명확하다. 어느 것도 모델의 새 능력을 요구하지 않는다. 모두 모델 안에 이미 존재하는 도메인 교차를 어떤 각도에서 깨울 것인가에 관한 설계다.
다시 말해 — LLM 시대에 차이를 만드는 건 답의 품질이 아니라 질문의 구조다. 같은 모델에게 같은 정보를 주고, 한 사람은 단일 도메인 답을 받고 다른 사람은 도메인 교차 통찰을 받는다. 둘 사이에 있는 것은 모델의 능력 차이가 아니라 질문 설계의 차이다.
드러켄밀러가 LLM을 쓴다면 어떻게 쓸까. 분명히 "이 종목 어때?"라고는 묻지 않을 것이다. 그는 한 번도 그런 식으로 사고한 적이 없다. 그는 항상 여러 섹터의 발표를 동시에 듣고 사이의 진공을 찾는 사람이었다.
그가 LLM에게 던질 질문은 아마 이런 형태일 것이다.
"반도체 8개 회사, 자동차 5개 회사, 소비재 5개 회사의 최근 분기 실적 코멘터리를 동시에 보고, 어느 한 회사도 명시적으로 말하지 않았지만 셋을 겹쳐 읽으면 드러나는 매크로 시그널 3가지를 추출해줘."
그가 LLM의 진짜 능력을 끌어내는 사람일 것이다. 우리 대부분은 같은 모델을 쓰면서 그 능력의 10%만 사용한다.
차이는 모델에 있지 않다. 질문에 있다.
---
이 글은 우리의 이전 글 "Linguistic Diversity and Emergence — Where Does LLM Intelligence Come From?"의 응용편입니다. 그 글이 LLM의 창발 메커니즘에 관한 가설이었다면, 이 글은 그 메커니즘을 사용자가 어떻게 활성화할 것인가에 관한 실용 매뉴얼입니다.