데이터 분석을 위한 URL

데이터 분석을 위한 기초, URL 이해하기

안녕하세요, 뷰저블입니다.

웹/앱의 데이터 분석을 하기 위한 URL 기반의 분석 도구가 많은데요, 여러분은 URL의 구조에 대해 얼마나 알고 계신가요? 분석 도구를 사용하면서 URL을 어떻게 구분해서 사용해야 하는지 어렵진 않으셨나요? 오늘은 URL의 기본 개념과 구조를 이해하고, 나아가 데이터 분석 도구에서 어떤 식으로 활용되는 지까지 함께 살펴보도록 할게요!


URL과 도메인은 다르다?



도메인(Domain)은 IP 주소를 갖는 서버를 사용자가 쉽게 기억하고 찾을 수 있도록 만들어준 서비스입니다. 실제 컴퓨터와의 통신에서는 숫자로 표현된 주소(=IP)를 사용하기 때문에 이를 변환시켜 줄 네임 서버가 필요하죠.

URL(Uniform Resource Locator)은 도메인을 포함한 경로입니다. 사용자가 도메인 서버로 접속할 때, 프로토콜과 서비스타입을 통합적으로 적어준 것이라고 볼 수 있는데요,

도메인 기관(국가 도메인, 지역 도메인, 교육기관 등)에 따라 도메인 명은 각각 다르게 인식하고 사용자(서비스)가 서로 다를 수 있습니다.


예시를 통해 다시 한번 짚어볼까요?

예를 들어, https://www.beusable.net 전체 주소는 URL이며, https는 프로토콜, www.beusable.net은 도메인으로 분류할 수 있습니다.



도메인과 URL의 구조 파헤치기



1. 도메인의 구조

도메인의 구조를 먼저 살펴볼까요? 도메인은 호스트명(차상위 도메인/서브 도메인), 도메인명, 최상위 도메인 명으로 이루어져 있습니다.



1단계: 최상위 도메인 (TLD, Top-Level Domain)

도메인 레벨 중에 가장 높은 단계에 있는 도메인입니다. 도메인의 목적, 종류, 국가를 나타냅니다.


2단계: 차상위 도메인 (SLD, Second-Level Domain)

호스트, 서브 도메인으로 불리기도 합니다. 보조 도메인으로써, URL로 전송하거나 계정 내의 IP주소나 디렉토리로 포워딩되는 도메인 이름의 확장자입니다.


3단계: 도메인 이름 (Domain Name)

임의로 지정할 수 있는 사이트의 이름입니다. 익히 알고 있는 google, naver, daum 등 사용자에게 쉽게 기억될 수 있도록, 보통 서비스명으로 도메인명을 지정해 사용합니다.


아래 이미지 예시를 보면, 하나의 URL에 1-3단계가 모두 존재하는 것을 확인할 수 있습니다.



2. URL의 구조


도메인에 대해 알아보았다면, 이제 도메인을 포함하는 URL의 구조에 대해 알아볼까요?



URL은 보통 http또는 https와 같은 Protocol, 호스트명, 도메인명 상위 도메인명으로 이루어진 Domain, Path, Parameter, Fragment로 이루어져 있습니다.

프로토콜과 도메인은 익숙해도, Path, Parameter, Fragment는 낯선 분들이 많으실텐데요, 아래에 더 자세하게 설명해드릴게요!


path (/)

파일의 경로를 가리키며, / (슬래시) 뒤에 나옵니다. 폴더 내에 파일과 폴더를 계속 만들 수 있는 것처럼 컴퓨터의 폴더와 비슷한 개념으로 생각하시면 이해하기 쉽습니다.

∙예시: https://www.beusable.net/blog/files/pdf


parameter (?)

파라미터는 쿼리 스트링이라고도 부르며, key(파라미터의 이름)=value(파라미터의 값) 형태로 이루어집니다. ?(물음표) 뒤에 나열되고, & 기호로 구분되어 여러 개가 존재할 수 있습니다. 광고 분석시 많이 사용되는 UTM(Urchin Tracking Module)이 query parameter를 이용한 사용자 추적 서비스입니다. UTM으로 예시를 들어볼까요?

∙예시: https://www.beusable.net/blog?utm_source=google&utm_medium=blog&utm_campaign=beusable&utm+content=domaincontent


fragment (#)

해시태그(Hashtag), 앵커(Ancher)라고도 부릅니다. 특정 요소를 지시할 수 있는데요, 예를 들어 해시태그로 이동을 원하는 요소의 id를 링크로 연결하면, 스크롤 이동없이 바로 해당 위치로 이동합니다. 또한 파일 디렉토리 및 파일이름과 유사한 역할로 쓰이는 경우도 있습니다.

∙ 예시: https://www.beusable.net/blog/#content



데이터 분석에 URL 활용하기


URL의 구조에 대해 알아보았는데요, 그렇다면 URL은 데이터 분석에 어떻게 활용되고 있을까요?

뷰저블에서 URL을 활용하는 방식에 대해 공유드립니다! 아래의 내용을 이해하신다면, 뷰저블 뿐만 아니라 타 서비스를 이용할 때에도 URL에 대한 어려움없이 접근하실 수 있을 거에요.


1. 뷰저블에서 분석할 URL 입력하기

뷰저블에서는 매치타입을 선택해 분석 목적에 따라 원하는 데이터를 수집하실 수가 있는데요, 매치타입의 종류와 분석 목적에 따라 선택해야 하는 매치타입을 알아 볼까요?



뷰저블에서 제공하는 URL 구조표 입니다. 이중에서 변수가 발생할 수 있는 부분은 프로토콜, 호스트, 파라미터, 플래그먼트인데요, 매치타입을 선택하실 때 이 변수에 주의하셔야 합니다.

뷰저블에서 가장 많이 쓰이는 매치타입은 Exact 와 Simple으로 정반대의 특성을 지닙니다. Exact는 입력한 URL과 100% 일치(프로토콜까지) 해야하고, Simple은 입력한 URL의 도메인과 패스가 일치하는 모든 URL의 데이터를 수집합니다. 이러한 특징에 따라 정확하게 해당 페이지만의 데이터를 수집하고 싶을 땐 Exact 매치를 선택하고, 마케팅/광고 등으로 URL에 발생하는 변수를 포함해 데이터를 수집하고 싶을 땐 Simple 매치를 선택해야 하죠.

분석 목적에 따라 데이터 수집도 달라져야 한다는 점! 매치 타입이 존재하는 이유에 대해 이해하셨나요?

매치타입 별 특징과 분석 목적에 따른 선택 가이드의 자세한 내용은 아래 표를 참고해 주세요! 데이터 분석시, 수집되는 데이터를 이해해야 분석 목적에 따라 원하는 데이터를 수집할 수 있습니다.


<뷰저블 매치타입 가이드>

참고: 뷰저블 페이지 등록 가이드



2. 뷰저블 애널리틱스에서 분석할 도메인 입력하기


key!

뷰저블과 달리 별도의 매치타입을 필요로 하지는 않습니다. 하지만 여정이 어떤 데이터를 수집해 그려지는 지 이해하시면, 고객을 더 깊이있게 이해하실 수 있을 거에요!


뷰저블 애널리틱스에서는 입력한 도메인 명과 최상위 도메인만 일치하면, 하위의 모든 페이지들에 대한 데이터를 수집해 여정을 그립니다.



위 예시처럼 서브 도메인이 같지않더라도 모든 데이터를 수집해 여정을 그립니다. 서브도메인이 www인 홈페이지를 보다가, 서브도메인이 tool인 서비스를 사용하더라도 끊기지 않고 하나의 여정으로 확인이 가능합니다.

만약 분석하고 싶지 않은 서브도메인이 있다면, 분석을 원하는 페이지에만 코드 삽입이 필요합니다. 예를 들어, 실제 고객이 접속하는 URL이 아닌 내부 테스트용 사이트를 제외하고 싶으시다면, 실제 서비스의 서브도메인 하위에만 트래킹코드를 설치해 보세요.


참고: 뷰저블 애널리틱스의 코드설치가이드


오늘은 URL과 도메인에 대해 알아보았습니다. URL에 대한 궁금증이 풀리셨나요?

이번 글에서는 뷰저블을 예시로 분석도구에서 URL을 데이터 분석에 어떻게 활용하는 지 소개해드렸습니다. 뷰저블 이외에도 URL을 활용한 분석 도구나 서비스가 많이 존재하는데요! 해당 서비스들을 이용하거나 업무시 커뮤니케이션에 이번 글이 도움이 되었으면 좋겠습니다.

그럼 다음에도 여러분께 유용한 글을 준비해서 다시 찾아오도록 할게요! 다음 글도 많이 기대해 주세요.



참고: 뷰저블 블로그의 URL 분석하기 시리즈
URL 분석하기 (1/2)
URL 분석하기 (2/2)



Print Friendly, PDF & Email

Share This Post

Share on facebook
Share on linkedin
Share on twitter
Share on email

Related