크롤링이 Access Denied 나 로봇체크 등이 나오는 경우에는
해외 쇼핑몰 서버에 보안 프로그램이 설치 되어
코스모스3/투드림과 같은 웹 로봇을 차단하는 경우입니다.
이런 경우에는 아래와 같은 방법을 시도해 보실 수 있습니다.
일반적인 방법(예: requests, curl)으로 웹페이지에 접속했을 때 403 Forbidden, Captcha, 혹은 Cloudflare 등의 차단 화면이 나오는 경우, Scraping API(스크래핑 API) 서비스를 사용하면 문제를 해결할 수 있습니다.
이 서비스들은 전 세계에 분산된 **수백만 개의 프록시 IP(Residental Proxy)**를 사용하고, **헤드리스 브라우저(Headless Browser)**를 통해 실제 사람처럼 행동하여 차단을 우회합니다.
주요 서비스들과 그 특징을 정리해 드립니다.
다음 서비스들은 URL만 넘기면 알아서 IP를 회전시키고, Captcha를 풀며, JavaScript를 렌더링한 후 최종 HTML을 반환해 줍니다.