티스토리 뷰

SMALL

들어가며

AI 에이전트가 실제 웹 브라우저를 제어할 수 있다면 어떨까요? OpenClaw는 이제 전용 브라우저 프로필을 통해 에이전트가 안전하게 웹을 탐색하고 조작할 수 있는 강력한 자동화 환경을 제공합니다. 개인 브라우저와 완전히 격리된 독립적인 환경에서 AI가 탭을 열고, 페이지를 읽고, 클릭하고, 타이핑할 수 있습니다. 이는 웹 자동화와 AI 에이전트의 새로운 가능성을 열어주는 중요한 발전입니다.

OpenClaw Browser의 핵심 기능

완전히 격리된 브라우저 환경

OpenClaw는 Chrome, Brave, Edge, Chromium 등 Chromium 기반 브라우저의 전용 프로필을 실행합니다. 가장 중요한 점은 개인 브라우저 프로필과 완전히 분리되어 있다는 것입니다. openclaw라는 이름의 별도 프로필은 기본적으로 오렌지색 테마로 표시되며, 로컬 제어 서비스를 통해 관리됩니다.

# 브라우저 상태 확인
openclaw browser --browser-profile openclaw status

# 브라우저 시작
openclaw browser --browser-profile openclaw start

# 웹페이지 열기
openclaw browser --browser-profile openclaw open https://example.com

# 현재 페이지 스냅샷 생성
openclaw browser --browser-profile openclaw snapshot

두 가지 프로필 모드

  1. openclaw 프로필 (관리형 격리 브라우저)
  2. 전용 Chrome 인스턴스로 익스텐션 불필요
  3. 완전한 격리 환경 제공
  4. CDP(Chrome DevTools Protocol)를 통한 직접 제어
  5. chrome 프로필 (익스텐션 릴레이)
  6. 기존 Chrome 탭을 제어
  7. OpenClaw Browser Relay 익스텐션 필요
  8. 수동으로 탭에 연결

강력한 자동화 기능

OpenClaw Browser는 다음과 같은 세밀한 제어를 제공합니다:

탭 관리 - 결정론적 탭 컨트롤 (targetId 기반) - 탭 목록, 열기, 포커스, 닫기

에이전트 액션 - 클릭, 더블클릭, 호버 - 텍스트 입력 및 제출 - 드래그 앤 드롭 - 셀렉트 박스 선택 - 스크롤

검사 및 디버깅 - AI 최적화된 스냅샷 (숫자 참조) - ARIA 접근성 트리 - 전체/부분 스크린샷 - PDF 생성 - 콘솔 로그 및 에러 추적 - 네트워크 요청 모니터링

다중 프로필 지원과 원격 제어

프로필 설정

~/.openclaw/openclaw.json 파일을 통해 여러 브라우저 프로필을 구성할 수 있습니다:

{
  "browser": {
    "enabled": true,
    "defaultProfile": "openclaw",
    "color": "#FF4500",
    "headless": false,
    "executablePath": "/Applications/Brave Browser.app/Contents/MacOS/Brave Browser",
    "profiles": {
      "openclaw": { 
        "cdpPort": 18800, 
        "color": "#FF4500" 
      },
      "work": { 
        "cdpPort": 18801, 
        "color": "#0066CC" 
      },
      "remote": { 
        "cdpUrl": "http://10.0.0.42:9222", 
        "color": "#00AA00" 
      }
    }
  }
}

Browserless 통합

호스팅된 Chromium 서비스인 Browserless와도 통합 가능합니다:

{
  "browser": {
    "defaultProfile": "browserless",
    "profiles": {
      "browserless": {
        "cdpUrl": "https://production-sfo.browserless.io?token=<API_KEY>",
        "color": "#00AA00"
      }
    }
  }
}

스냅샷과 참조(Ref) 시스템

OpenClaw는 두 가지 스냅샷 방식을 지원합니다:

1. AI 스냅샷 (숫자 참조)

openclaw browser snapshot
# 출력: aria-ref="12", aria-ref="23" 등의 숫자 참조

# 액션 실행
openclaw browser click 12
openclaw browser type 23 "hello"

2. 역할 스냅샷 (역할 참조)

openclaw browser snapshot --interactive
# 출력: [ref=e12], [ref=e23] 등의 역할 참조

# 액션 실행
openclaw browser click e12
openclaw browser highlight e12

# 라벨 오버레이로 시각화
openclaw browser snapshot --interactive --labels

역할 스냅샷은 특히 유용한 옵션들을 제공합니다: - --interactive: 상호작용 가능한 요소만 평면 리스트로 표시 - --compact: 간결한 출력 - --efficient: AI 최적화된 프리셋 (interactive + compact + depth 조합) - --selector "#main": 특정 요소로 범위 제한 - --frame "iframe#main": iframe 내부로 범위 제한

고급 대기(Wait) 기능

단순 시간 대기를 넘어선 강력한 대기 조건:

# URL 패턴 대기
openclaw browser wait --url "**/dash"

# 네트워크 유휴 상태 대기
openclaw browser wait --load networkidle

# JavaScript 조건 대기
openclaw browser wait --fn "window.ready===true"

# 셀렉터 가시성 대기
openclaw browser wait "#main"

# 복합 조건
openclaw browser wait "#main" \
  --url "**/dash" \
  --load networkidle \
  --fn "window.ready===true" \
  --timeout-ms 15000

상태 관리와 환경 설정

개발 및 테스트를 위한 세밀한 환경 제어:

# 쿠키 관리
openclaw browser cookies
openclaw browser cookies set session abc123 --url "https://example.com"

# 로컬/세션 스토리지
openclaw browser storage local set theme dark

# 오프라인 모드
openclaw browser set offline on

# 커스텀 헤더
openclaw browser set headers --headers-json '{"X-Debug":"1"}'

# 지리적 위치
openclaw browser set geo 37.7749 -122.4194 --origin "https://example.com"

# 다크 모드
openclaw browser set media dark

# 타임존 및 로케일
openclaw browser set timezone America/New_York
openclaw browser set locale en-US

# 디바이스 에뮬레이션
openclaw browser set device "iPhone 14"

보안과 격리 보장

OpenClaw Browser는 보안을 최우선으로 설계되었습니다:

  1. 전용 사용자 데이터 디렉토리: 개인 브라우저 프로필과 절대 접촉하지 않음
  2. 전용 포트: 9222 포트 대신 18800-18899 범위 사용으로 개발 워크플로우 충돌 방지
  3. 로컬호스트 전용 제어: 브라우저 제어 서비스는 loopback에만 바인딩
  4. 자동 인증 토큰: auth가 미설정 시 자동으로 gateway.auth.token 생성 및 저장
  5. 원격 CDP 보안: HTTPS 엔드포인트와 단기 토큰 사용 권장
# Chrome 익스텐션 설치 (수동 제어용)
openclaw browser extension install

디버깅 워크플로우

액션 실패 시 체계적인 디버깅:

# 1. 상호작용 스냅샷으로 요소 확인
openclaw browser snapshot --interactive

# 2. 참조로 액션 실행
openclaw browser click e12

# 3. 실패 시 하이라이트로 타겟 확인
openclaw browser highlight e12

# 4. 에러 및 네트워크 로그 확인
openclaw browser errors --clear
openclaw browser requests --filter api --clear

# 5. 상세 추적
openclaw browser trace start
# 문제 재현
openclaw browser trace stop
# TRACE:<경로> 출력됨

개발자를 위한 의미와 전망

즉각적인 활용 가치

  1. 웹 자동화 테스트: Playwright와 유사하지만 AI 에이전트가 직접 제어
  2. 데이터 수집: 결정론적이고 재현 가능한 웹 스크래핑
  3. 모니터링: 웹사이트 상태 및 변경사항 자동 추적
  4. 크로스 브라우저 테스팅: 다중 프로필로 다양한 환경 시뮬레이션

AI 에이전트의 진화

OpenClaw Browser는 AI 에이전트가 단순 API 호출을 넘어 실제 웹 환경과 상호작용할 수 있게 합니다. 에이전트는 이제:

  • 복잡한 다단계 웹 작업 수행
  • 시각적 컨텍스트를 이해하며 작업
  • 동적 웹 애플리케이션과 상호작용
  • 사람처럼 웹을 탐색하고 정보 수집

주의사항

browser act kind=evaluate나 JavaScript 실행 기능은 강력하지만, 프롬프트 인젝션 공격에 취약할 수 있습니다. 신뢰할 수 없는 입력에는 browser.evaluateEnabled=false 설정을 권장합니다.

결론

OpenClaw Browser는 AI 에이전트와 웹 자동화의 경계를 허물고 있습니다. 격리된 환경, 강력한 제어 기능, 그리고 AI 최적화된 인터페이스의 조합은 개발자에게 새로운 가능성을 제시합니다. 특히 다중 프로필 지원과 원격 제어 기능은 복잡한 시나리오에서도 유연하게 대응할 수 있게 합니다.

Playwright 기반의 안정적인 구조 위에 AI 친화적인 추상화를 더한 이 도구는, 웹 자동화의 미래가 단순 스크립팅에서 지능형 에이전트 기반으로 전환되고 있음을 보여줍니다. 개인 브라우저와의 완전한 격리는 보안과 안정성을 보장하며, 개발자는 안심하고 실험하고 배포할 수 있습니다.

Original Source


추가 리소스: - Docker에서 Playwright 설치하기 - Browser 로그인 및 X/Twitter 포스팅 - Linux 문제 해결

LIST
댓글
D-DAY
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2026/05   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함