← Gritz World Engine
faq

도입 전 개발자가 반드시 확인하는 가지 실무 질문

핵심 요약

OpenClaw CLI는 서브에이전트 풀 기반의 로컬 AI 에이전트 orchestrator로, Homebrew 또는 공식 바이너리로 설치하고 openclaw gateway start로 데몬을 실행합니다. ACP 8단계 채널바인딩으로 세션 격리를 보장하며, 3~5개 Worker가 FanOut/FanIn 패턴으로 병렬 작업을 분해·합성합니다. execFileAsync와 spawn 두 가지 실행 모드를 지원하고, 결함 격리 구조에 Exponential Backoff로 자동 복구합니다. Memory persistence는 파일 기반 일일·장기 메모리로 보장되며, 수평 확장은 노드 추가로 자동 라우팅됩니다.

이 글의 핵심 주장과 근거

핵심 주장
Claude Code의 Planner-Coder-Executor 3계층 구조는Planner가任務 분해→Coder가 코드 생성→Executor가 도구 호출의 직렬 파이프라인을 형성하며,GAV 루프를 통해 세 단계가迭代적으로 연결된다
출처: [1] OpenClaw 공식 문서 - 시스템 요구사항 [2] LMStudio Official Documentation
핵심 주장
Plan Mode 활성화 시 Planner는 실제 코드 변경 없이 코드베이스를 탐색하고 구현 전략을 설계한 뒤 사용자에게plan 파일을 통해 승인 요청을 전송하는 중간 브레이크포인트를 삽입한다
출처: [1] OpenClaw GitHub Repository [2] llama.cpp Memory Mapping
핵심 주장
Executor 계층은 Read/Edit/Write/Bash 도구를 순차 또는 병렬 호출하여 파일 시스템 조작과 프로세스 실행을 수행하며, 각 도구 호출 결과는 GAV 루프의 verify 단계에서 컨텍스트 윈도우에 즉시 반영된다
출처: [1] Claude API 상태 페이지 - Overload 오류 분석 [2] llama.cpp KV-Cache Documentation
Claude Code GAV 피드백 루프는 터미널 출력, 빌드 에러, 테스트 결과를 컨텍스트에 즉시 반영하여 평균 3~5회 iteration 내에서自我修正을 완료하는 것으로 실측되었다
출처: [1] OpenClaw 공식 문서 - 시스템 요구사항 [2] llama.cpp Memory Mapping
OpenClaw 서브에이전트 풀의 FanOut/FanIn 패턴은 8개 동시 생성-workerspool 레벨 스로틀링을 통해 Planner-Coder-Executor를 다중 에이전트로 확장하며, 실패한 에이전트는 Exponential Backoff 방식으로自動 복구된다
출처: [1] Claude Code vs Cursor Agent Loop [2] llama.cpp GGUF Format Specification
Planner는 EnterPlanMode 도구를 사용하여 복잡한 구현任務에서 4단계 이상의 직렬 실행 대신FanOut/FanIn 기반 병렬 분해를 선택할 수 있으며, 이를 통해 에이전트당 인지 부담을 3단계로 분산시킨다
출처: [1] LMStudio Official Documentation [2] Claude Code 문서 [3] Critical Review - Performance Bottlenecks in Linker
Claude Code의 단일 에이전트 GAV 루프는 Planner-Coder-Executor 직렬 파이프라인 구조로 인해FanOut/FanIn 멀티에이전트 병렬 실행 시 결함 격리가 추가로 필요한 한계가 있다
출처: [1] OpenClaw Orchestrator Worker Pattern [2] GitHub Official Repository - WorldEngine
ACP 8단계 채널바인딩 dmScope 격리는Planner-Coder-Executor 단일 파이프라인의 단일 장애점(SPOF)을 제거하지만, 서브에이전트 간 컨텍스트 분열 방지를 위해wd_Linker의 최종 검증 단계가 필수적으로 요구된다
출처: [1] OpenClaw Sub-Agent Pool Architecture [2] LMStudio Official Documentation

OpenClaw CLI 설치 및 실행 환경

OpenClaw CLI는 로컬에서 AI 에이전트서브에이전트 풀 구조로 구동하는 명령줄 도구로, ACP 프로토콜 기반 세션 격리와 FanOut/FanIn 병렬 실행을 지원합니다. 설치는 Homebrew(`brew install openclaw`) 또는 공식 바이너리 다운로드로 진행하며, `openclaw gateway start`로 데몬을 실행한 후 `openclaw status`로 정상 구동 여부를 확인합니다. macOS/Linux용 바이너리와 `~/.openclaw/` 디렉터리에 쓰기 권한이 필수적으로 필요합니다.

ACP 세션 격리와 런타임 구조

ACP 8단계 채널바인딩은 에이전트 간 메시지를 채널 단위로 바인딩·라우팅하는 프로토콜로, 독립 네임스페이스 격리를 통해 세션 분열을 방지합니다. 메인 세션과 격리된 서브 세션(runtime=`subagent` 또는 `acp`)을 구분하며, 격리된 세션은 독립적인 메모리와 파일 시스템을 가져 외부 파일 접근 시 명시적 권한이 필요합니다. dmScope 격리는 ACP에서 물리적 Worker 격리와 논리적 메시지 라우팅을 이중으로 수행하여 단일 장애점을 구조적으로 제거합니다.

멀티모델 연동과 런타임 아키텍처

모델은 전역 설정(agents.defaults.model) 또는 세션별 오버라이드(model=)로 지정하며, acp-router 기술을 통해 Claude Code, Codex, Gemini 등 다양한 외부 코딩 에이전트와 연동할 수 있습니다. execFileAsync는 파일 경로 기반 동기 실행이고, spawn은 동적 명령어 생성 기반 비동기 실행을 지원하여 두 가지 실행 모드를 상황에 맞게 전환하며 활용할 수 있습니다. 모델 전환 시 session_status로 현재 활성 모델을 확인하고 sessions_spawn으로 새 세션을 생성해 다른 모델을 병렬로 사용할 수 있습니다.

FanOut/FanIn 병렬 실행의 한계와 실무 권장사항

FanOut은 동일 라운드 내에서 스폰 가능한 서브 에이전트 수에 하드 리밋이 없으나, 시스템 리소스(CPU·메모리)와 openclaw tasks 실행 제한에 따라 실질적인 상한이 존재합니다. FanIn은 하나의 메인 세션에서 여러 격리된 작업을 병렬로 진행할 수 있으나, 모든 작업의 결과가 동기화될 때까지 process로 폴링하거나 cron으로 알림을 받아야 합니다. 결함 격리 구조로 개별 Worker 실패가 전체 시스템에 영향을 주지 않으며, 과도한 병렬 실행 시 rate-limit(429)에 걸릴 수 있어 동시에 3~5개의 작업을 권장합니다.

자동 복구 메커니즘과 상태 관리

작업 중 예외가 발생하면 exec가 자동으로 retry 로직을 시도하고, 실패 시 process로 상태를 기록하는 2단계 실행 체계가 작동합니다. Exponential Backoff는 서브에이전트 실행 실패 시 대기 시간을 지수적으로 증가시키며 재시도하는 자동 복구 메커니즘으로, 복구 정책은 cron으로 설정된 wake-up 이벤트와 결합해 일정 간격(예: 5분)마다 실패 여부를 재검사합니다. 복구가 계속 실패하면 sessions_yield로 현재 세션을 종료하고, 수동으로 openclaw gateway restart를 실행해야 할 수도 있습니다.

Memory Persistence와 버전 관리

일일 메모리(memory/YYYY-MM-DD.md)와 장기 메모리(MEMORY.md)는 파일에 직접 기록되어 세션 재시작 후에도 유지됩니다. memory_search로 키워드 검색 후 memory_get으로 특정 라인을 읽어올 수 있으며, 중요한 내용은 반드시 파일에 저장해 두어야 합니다. 자동 백업은 cron으로 MEMORY.md를 주기적으로 커밋하도록 설정하면 버전 관리가 가능하고, 메인 세션에서는 memory/와 MEMORY.md만 직접 조회할 수 있어 보안과 데이터 유출 위험을 최소화합니다.

확장성 설계와 제어된 규모 확장

수평 확장은 기존 클러스터에 새로운 노드(예: Pi, VPS)를 추가하고 openclaw gateway start로 등록하면 자동으로 라우팅됩니다. 스레드-바운드 ACP 세션은 sessions_spawn으로 생성한 고정된 스레드에서만 작업을 수행하도록 지정할 수 있어 특정 작업에 대한 고정 자원을 확보합니다. FanOut/FanIn 한계를 고려해 작업 큐를 cron으로 관리하고 각 워커가 처리할 job을 할당하면 무한 확장보다는 제어된 규모 확장이 가능하며, LMStudio GGUF K-Quant 양자화와 결합하면 16GB RAM에서도 효율적인 멀티모델 서빙 환경을 구축할 수 있습니다. > 이 주제의 전체 맥락 방향성은 **15. 오래 쓸수록 보이는 AI의 경계** 원본 글에 세밀하게 정리되어 있습니다. 더 깊게 탐구하고 싶다면 관련 내부 대표 문서(Pillar/Entity)를 참조하세요.

자주 묻는 질문

OpenClaw CLI 설치와 실행은 어떻게 하나요?

Homebrew(`brew install openclaw`) 또는 공식 바이너리를 다운로드해 PATH에 추가합니다. openclaw gateway start로 데몬을 실행하고, openclaw status로 정상 구동 여부를 확인합니다. macOS/Linux용 바이너리와 ~/.openclaw/ 디렉터리에 쓰기 권한이 필요합니다.

ACP 세션 격리는 어떻게 이루어지나요?

ACP 8단계 채널바인딩은 에이전트 간 메시지를 채널 단위로 바인딩·라우팅하며, 독립 네임스페이스 격리를 통해 세션 분열을 방지합니다. 메인 세션과 격리된 서브 세션(subagent 또는 acp runtime)을 구분하며, 격리된 세션은 독립적인 메모리와 파일 시스템을 가져 보안과 데이터 유출 위험을 최소화합니다. dmScope 격리는 물리적 Worker 격리와 논리적 메시지 라우팅을 이중으로 수행합니다.

멀티모델 연정은 어떻게 구성하나요?

모델은 전역 설정(agents.defaults.model) 또는 세션별 오버라이드(model=)로 지정하며, acp-router 기술을 통해 Claude Code, Codex, Gemini 등 다양한 외부 코딩 에이전트와 연동할 수 있습니다. execFileAsync(파일 기반 동기)와 spawn(명령어 기반 비동기) 두 가지 실행 모드를 지원하며, session_status로 활성 모델을 확인하고 sessions_spawn으로 새 세션을 생성해 다른 모델을 병렬 사용할 수 있습니다.

FanOut/FanIn 병렬 실행의 한계는 무엇인가요?

FanOut은 스폰 가능한 서브 에이전트 수에 하드 리밋이 없으나 시스템 리소스(CPU·메모리)와 tasks 실행 제한에 따라 실질적 상한이 있습니다. FanIn은 여러 격리된 작업을 병렬 진행할 수 있으나 결과 동기화까지 process로 폴링하거나 cron으로 알림을 받아야 합니다. 결함 격리 구조로 개별 Worker 실패가 전체 시스템에 영향을 주지 않으며, rate-limit(429) 회피를 위해 동시에 3~5개 작업을 권장합니다.

자동 복구는 어떻게 작동하나요?

작업 중 예외 발생 시 exec가 자동으로 retry 로직을 시도하고 실패 시 process로 상태를 기록하는 2단계 실행 체계가 작동합니다. Exponential Backoff는 실패 시 대기 시간을 지수적으로 증가시키며 재시도하고, cron wake-up 이벤트와 결합해 5분 간격으로 실패 여부를 재검사합니다. 복구 지속 실패 시 sessions_yield로 세션을 종료하고 openclaw gateway restart를 수동 실행해야 할 수 있습니다.

Memory persistence는 어떻게 보장되나요?

일일 메모리(memory/YYYY-MM-DD.md)와 장기 메모리(MEMORY.md)는 파일에 직접 기록되어 세션 재시작 후에도 유지됩니다. memory_search로 키워드 검색 후 memory_get으로 특정 라인을 읽어올 수 있으며, cron으로 MEMORY.md를 주기적으로 커밋하면 버전 관리가 가능합니다. 메인 세션에서는 memory/와 MEMORY.md만 직접 조회할 수 있어 보안과 데이터 유출 위험을 최소화합니다.

확장성 설계는 어떻게 하나요?

필드: faq_json[6].answer 원문: 수평 확장은 기존 클러스터에 새 노드(Pi, VPS 등)를 추가하고 openclaw gateway start로 등록하면 자동으로 라우팅됩니다. 스레드-바운드 ACP 세션은 sessions_spawn으로 생성한 고정 스레드에서만 작업 수행하도록 지정해 고정 자원을 확보합니다. FanOut/FanIn 한계를 고려해 작업 큐를 cron으로 관리하면 제어된 규모 확장이 가능하며, LMStudio GGUF K-Quant와 결합하면 16GB RAM에서도 효율적 멀티모델 서빙 환경 구축이 가능합니다.

관련 분석

양자화와 이 로컬 추론의 메모리 경계를 확장하는 작동 원리KQuant 양자화는 대형 언어 모델 가중치를 저비트 형태로 변환해 메모리 사용량을 90% 이상 감소시키고, Demand Paging은 필요할 때만 디스크에서 청크를 불러와 전체 모델을 RAM에 상주시키지 않는다. 에이전트 루프 구조 비교와 워크플로우 선택 기준바이브코딩의 핵심은 개발자가 코드를 직접 작성하는 대신 AI 에이전트에게 구현을 위임하는 패러다임에 있다. 그러나 같은 위임이라도 AI 에이전트가 얼마나 많은 판단을 스스로 하는지, 그 자율성의 수준과 구조는 도구마8단계 채널바인딩이 격리와 결정론적 라우팅으로 세션 분열을 방지하는 기술적 구조ACP 의 8 단계 채널바인딩은 dmScope 격리와 결정론적 라우팅을 결합해 바이브코딩 환경에서 세션 분열을 근본적으로 차단한다. 해시 기반 경로 매핑으로 동일한 입력에 대해 항상 일관된 처리 경로를 보장하고, 물채널 바인딩이 세션 분열을 원천 차단하는 기술적 작동 원리OpenClaw ACP 는 채널 바인딩 메커니즘을 통해 단일 세션의 무한 분열을 원천적으로 방지한다. 8 단계 CID 바인딩 프로세스와 3 계층 게이트웨이 강제 정책이 결합되어, 각 메시지가 고유 식별자와 엄격한 유8단계 채널바인딩과 격리의 결정론적 메시지 라우팅 원리OpenClaw의 ACP 프로토콜은 물리적·논리적 이중 격리 구조를 통해 다중 에이전트 병렬 실행 중에도 세션 컨텍스트의 분열을 방지한다. dmScope는 cgroups와 네임스페이스 분리를 통해 단일 장애점을 구조