티스토리 뷰
들어가며
AI 에이전트가 실제 웹 브라우저를 제어할 수 있다면 어떨까요? OpenClaw는 이제 전용 브라우저 프로필을 통해 에이전트가 안전하게 웹을 탐색하고 조작할 수 있는 강력한 자동화 환경을 제공합니다. 개인 브라우저와 완전히 격리된 독립적인 환경에서 AI가 탭을 열고, 페이지를 읽고, 클릭하고, 타이핑할 수 있습니다. 이는 웹 자동화와 AI 에이전트의 새로운 가능성을 열어주는 중요한 발전입니다.
OpenClaw Browser의 핵심 기능
완전히 격리된 브라우저 환경
OpenClaw는 Chrome, Brave, Edge, Chromium 등 Chromium 기반 브라우저의 전용 프로필을 실행합니다. 가장 중요한 점은 개인 브라우저 프로필과 완전히 분리되어 있다는 것입니다. openclaw라는 이름의 별도 프로필은 기본적으로 오렌지색 테마로 표시되며, 로컬 제어 서비스를 통해 관리됩니다.
# 브라우저 상태 확인
openclaw browser --browser-profile openclaw status
# 브라우저 시작
openclaw browser --browser-profile openclaw start
# 웹페이지 열기
openclaw browser --browser-profile openclaw open https://example.com
# 현재 페이지 스냅샷 생성
openclaw browser --browser-profile openclaw snapshot
두 가지 프로필 모드
- openclaw 프로필 (관리형 격리 브라우저)
- 전용 Chrome 인스턴스로 익스텐션 불필요
- 완전한 격리 환경 제공
- CDP(Chrome DevTools Protocol)를 통한 직접 제어
- chrome 프로필 (익스텐션 릴레이)
- 기존 Chrome 탭을 제어
- OpenClaw Browser Relay 익스텐션 필요
- 수동으로 탭에 연결
강력한 자동화 기능
OpenClaw Browser는 다음과 같은 세밀한 제어를 제공합니다:
탭 관리 - 결정론적 탭 컨트롤 (targetId 기반) - 탭 목록, 열기, 포커스, 닫기
에이전트 액션 - 클릭, 더블클릭, 호버 - 텍스트 입력 및 제출 - 드래그 앤 드롭 - 셀렉트 박스 선택 - 스크롤
검사 및 디버깅 - AI 최적화된 스냅샷 (숫자 참조) - ARIA 접근성 트리 - 전체/부분 스크린샷 - PDF 생성 - 콘솔 로그 및 에러 추적 - 네트워크 요청 모니터링
다중 프로필 지원과 원격 제어
프로필 설정
~/.openclaw/openclaw.json 파일을 통해 여러 브라우저 프로필을 구성할 수 있습니다:
{
"browser": {
"enabled": true,
"defaultProfile": "openclaw",
"color": "#FF4500",
"headless": false,
"executablePath": "/Applications/Brave Browser.app/Contents/MacOS/Brave Browser",
"profiles": {
"openclaw": {
"cdpPort": 18800,
"color": "#FF4500"
},
"work": {
"cdpPort": 18801,
"color": "#0066CC"
},
"remote": {
"cdpUrl": "http://10.0.0.42:9222",
"color": "#00AA00"
}
}
}
}
Browserless 통합
호스팅된 Chromium 서비스인 Browserless와도 통합 가능합니다:
{
"browser": {
"defaultProfile": "browserless",
"profiles": {
"browserless": {
"cdpUrl": "https://production-sfo.browserless.io?token=<API_KEY>",
"color": "#00AA00"
}
}
}
}
스냅샷과 참조(Ref) 시스템
OpenClaw는 두 가지 스냅샷 방식을 지원합니다:
1. AI 스냅샷 (숫자 참조)
openclaw browser snapshot
# 출력: aria-ref="12", aria-ref="23" 등의 숫자 참조
# 액션 실행
openclaw browser click 12
openclaw browser type 23 "hello"
2. 역할 스냅샷 (역할 참조)
openclaw browser snapshot --interactive
# 출력: [ref=e12], [ref=e23] 등의 역할 참조
# 액션 실행
openclaw browser click e12
openclaw browser highlight e12
# 라벨 오버레이로 시각화
openclaw browser snapshot --interactive --labels
역할 스냅샷은 특히 유용한 옵션들을 제공합니다: - --interactive: 상호작용 가능한 요소만 평면 리스트로 표시 - --compact: 간결한 출력 - --efficient: AI 최적화된 프리셋 (interactive + compact + depth 조합) - --selector "#main": 특정 요소로 범위 제한 - --frame "iframe#main": iframe 내부로 범위 제한
고급 대기(Wait) 기능
단순 시간 대기를 넘어선 강력한 대기 조건:
# URL 패턴 대기
openclaw browser wait --url "**/dash"
# 네트워크 유휴 상태 대기
openclaw browser wait --load networkidle
# JavaScript 조건 대기
openclaw browser wait --fn "window.ready===true"
# 셀렉터 가시성 대기
openclaw browser wait "#main"
# 복합 조건
openclaw browser wait "#main" \
--url "**/dash" \
--load networkidle \
--fn "window.ready===true" \
--timeout-ms 15000
상태 관리와 환경 설정
개발 및 테스트를 위한 세밀한 환경 제어:
# 쿠키 관리
openclaw browser cookies
openclaw browser cookies set session abc123 --url "https://example.com"
# 로컬/세션 스토리지
openclaw browser storage local set theme dark
# 오프라인 모드
openclaw browser set offline on
# 커스텀 헤더
openclaw browser set headers --headers-json '{"X-Debug":"1"}'
# 지리적 위치
openclaw browser set geo 37.7749 -122.4194 --origin "https://example.com"
# 다크 모드
openclaw browser set media dark
# 타임존 및 로케일
openclaw browser set timezone America/New_York
openclaw browser set locale en-US
# 디바이스 에뮬레이션
openclaw browser set device "iPhone 14"
보안과 격리 보장
OpenClaw Browser는 보안을 최우선으로 설계되었습니다:
- 전용 사용자 데이터 디렉토리: 개인 브라우저 프로필과 절대 접촉하지 않음
- 전용 포트: 9222 포트 대신 18800-18899 범위 사용으로 개발 워크플로우 충돌 방지
- 로컬호스트 전용 제어: 브라우저 제어 서비스는 loopback에만 바인딩
- 자동 인증 토큰: auth가 미설정 시 자동으로
gateway.auth.token생성 및 저장 - 원격 CDP 보안: HTTPS 엔드포인트와 단기 토큰 사용 권장
# Chrome 익스텐션 설치 (수동 제어용)
openclaw browser extension install
디버깅 워크플로우
액션 실패 시 체계적인 디버깅:
# 1. 상호작용 스냅샷으로 요소 확인
openclaw browser snapshot --interactive
# 2. 참조로 액션 실행
openclaw browser click e12
# 3. 실패 시 하이라이트로 타겟 확인
openclaw browser highlight e12
# 4. 에러 및 네트워크 로그 확인
openclaw browser errors --clear
openclaw browser requests --filter api --clear
# 5. 상세 추적
openclaw browser trace start
# 문제 재현
openclaw browser trace stop
# TRACE:<경로> 출력됨
개발자를 위한 의미와 전망
즉각적인 활용 가치
- 웹 자동화 테스트: Playwright와 유사하지만 AI 에이전트가 직접 제어
- 데이터 수집: 결정론적이고 재현 가능한 웹 스크래핑
- 모니터링: 웹사이트 상태 및 변경사항 자동 추적
- 크로스 브라우저 테스팅: 다중 프로필로 다양한 환경 시뮬레이션
AI 에이전트의 진화
OpenClaw Browser는 AI 에이전트가 단순 API 호출을 넘어 실제 웹 환경과 상호작용할 수 있게 합니다. 에이전트는 이제:
- 복잡한 다단계 웹 작업 수행
- 시각적 컨텍스트를 이해하며 작업
- 동적 웹 애플리케이션과 상호작용
- 사람처럼 웹을 탐색하고 정보 수집
주의사항
browser act kind=evaluate나 JavaScript 실행 기능은 강력하지만, 프롬프트 인젝션 공격에 취약할 수 있습니다. 신뢰할 수 없는 입력에는 browser.evaluateEnabled=false 설정을 권장합니다.
결론
OpenClaw Browser는 AI 에이전트와 웹 자동화의 경계를 허물고 있습니다. 격리된 환경, 강력한 제어 기능, 그리고 AI 최적화된 인터페이스의 조합은 개발자에게 새로운 가능성을 제시합니다. 특히 다중 프로필 지원과 원격 제어 기능은 복잡한 시나리오에서도 유연하게 대응할 수 있게 합니다.
Playwright 기반의 안정적인 구조 위에 AI 친화적인 추상화를 더한 이 도구는, 웹 자동화의 미래가 단순 스크립팅에서 지능형 에이전트 기반으로 전환되고 있음을 보여줍니다. 개인 브라우저와의 완전한 격리는 보안과 안정성을 보장하며, 개발자는 안심하고 실험하고 배포할 수 있습니다.
추가 리소스: - Docker에서 Playwright 설치하기 - Browser 로그인 및 X/Twitter 포스팅 - Linux 문제 해결
'Ai' 카테고리의 다른 글
| OpenClaw 게이트웨이의 강력한 로깅 시스템: 개발자가 알아야 할 모든 것 (0) | 2026.02.19 |
|---|---|
| OpenClaw Gateway 완벽 가이드: 5분 만에 시작하는 AI 에이전트 관리 시스템 (0) | 2026.02.19 |
| [추천 오픈소스] 맥(macOS) 화면 캡처의 혁명, UI 인스펙터 'Xray'를 소개합니다! (1) | 2026.01.16 |
| AI 에이전트의 '금붕어 기억력', 파일 3개로 해결하기! (0) | 2026.01.16 |
| 국가대표 AI' 선발 이변, 네이버·NC 탈락 (0) | 2026.01.16 |