Cheers Hena ;) 259

[Tableau] 신병훈련소 실습 _스캐터 플롯(산점도) 시각화

Q. 스타벅스의 당분 함유량과 칼로리 상관관계 스캐터 플롯(산점도) 시각화 * 스캐터 플롯이란? == 산점도 2개의 연속형 데이터에 대한 상관관계를 분석할때 많이 사용되는 시각화 기법. 도표위에 두 변수 X,Y값이 만나는 지점을 표시. 두개의 축으로 데이터가 얼마나 펴져 있는지 분포를 살펴볼 수 있음. 상수라인/ 평균라인/ 사분위수 및 중앙값 / 추세선 등과 같은 참조라인을 추가하여 값의 분포 비교. 1. 행: 칼로리 / 열: 당류 칼로리 -Y축, 당류- X 축 현재 시각화는 전체 메뉴의 당류 합계와 칼로리 합계가 나타난다. 전체 합계가 아닌 각 메뉴별 당분과 칼로리를 표시 해주어야 한다. 2. 세부정보: 메뉴명 메뉴명을 마크선반의 세부정보로 가져다놓는다. 시각화 집계 기준이 전체 합계에서 -> 메뉴명 ..

[Tableau] 신병훈련소 실습 _ 도구설명에서 시트불러오기

Q.스타벅스 카테고리 기준으로 만든 시트와, 메뉴명 기준으로 만든 시트를 한번에 살펴보자. 1. 카테고리 기준 https://cheershennah.tistory.com/256 [Tableau] 신병훈련소 17기 1일차 실습 기록_ 스타벅스 카테고리별 평균 칼로리/카페인 막대차트 시 Q. 스타벅스 카테고리별 평균 칼로리/카페인 막대차트 시각화 1. 행: 카테고리 / 열: 칼로리 카테고리는 Y축, 칼로리는 X 축. 2. 집계 : 평균 하나의 카테고리 내에는 여러개의 메뉴가 있다. ex) 브루 cheershennah.tistory.com 2. 메뉴명 기준 https://cheershennah.tistory.com/257 [Tableau] 신병훈련소 17기 1일차 실습 기록_ 스타벅스 메뉴명 별 칼로리 & 카..

[Tableau] 신병훈련소 실습_ 스타벅스 메뉴명 별 칼로리 & 카페인 트리맵 시각화

Q. 스타벅스 메뉴명 별 칼로리 & 카페인 트리맵 시각화 * 트리맵 차트란? 트리맵 차트는 한눈에 알아볼 수 있는 가지와 하위 가지가 있는 트리와 같은 형식으로 데이터를 묘사한다. 트리 다이어그램의 계층 구조를 시각화하는 대체 방법이며 범주별 수량도 표시한다. 트리 분기를 사각형으로 표기되며 각 하위 분기는 작은 직사각형으로 표시된다. 데이터 패턴을 식별화하는 데 유용하다. 1. 마크 유형: 사각형 트리맵은 계층 데이터를 중첩된 사각형을 집합으로 표시하므로 마크 유형을 사각형으로 설정. 2. 카페인: 마크 색상 /칼로리 : 마크 크기 / 메뉴명: 마크 레이블에 드래그&드롭 카메인은 사각형의 색상으로, 칼로리는 사각형의 크기로 표현해준다. 레이블은 메뉴명을 표시해준다. 3. 카페인 색상 편집 원하는 색상으..

[Tableau] 신병훈련소 실습_막대차트 시각화

Q. 스타벅스 카테고리별 평균 칼로리/카페인 막대차트 시각화 1. 행: 카테고리 / 열: 칼로리 카테고리는 Y축, 칼로리는 X 축. 2. 집계 : 평균 하나의 카테고리 내에는 여러개의 메뉴가 있다. ex) 브루드 커피 카테고리 > 아이스 아메리카노, 오늘의 커피 .. 카테고리를 기준으로 합계로 집계시, 카테고리 내 모든 메뉴들의 카테고리와 카페인 값이 모두 더해져 카테고리 별 메뉴들의 총 합계 칼로리/ 카페인이 보여지므로 집계 측정을 평균으로 해주어야 함. 3. 내림차순 정렬 막대차트를 사용할 때 정렬되어있지 않으면 떨어져있는 막대 간 길이를 비교하는 것이 어렵다. 막대차트를 사용할때는 4. 카페인 색상 편집 가독성을 위해 색상 변경을 할 수 있다. 여기서는 카페인이 낮을수록 검정색, 높은수록 빨간색을 ..

[Tableau] 태블로란? 기본 사용법

태블로란 ? 데이터를 사용해 문제를 해결하는 시각적 분석 플랫폼. 데이터를 다루는 사람들에겐 널리 알려진 데이터 시각화 도구. 다른 도구들에 비교적 높은 자유도가 특징임. 데이터만 있다면 사용자가 원하는 각종 시각화 장표를 쉽고 빠르게 만들수 있음. 태블로 기본 사용법 1. 필드는 정성적인 값과 정량적인 값에 따라 차원과 측정값으로 구분 됨. 차원 정성적 데이터( 제품명, 날짜, 지리명 등) 분석 기준이 되는 값 불연속형 데이터로 측정값을 쪼개어 보는 하나의 관점. 측정값 정량적 수치, 연속형 데이터로 집계 되는 데이터. 2. 측정값은 차원을 기준으로 집계되어 표현된다. 집계 합계, 평균, 중앙값, 카운트, 카운트(고유), 최소값, 최대값, 백분위수, 표준편차, 분산 등을 의미. 즉, 하나의 측정값을 어..

[GA-Bigquery] 내 블로그에 누가 다녀갔을까? 주간 방문 데이터 분석

블로그를 개설한지 2018년부터 현재까지 운영중이고 초라했던 개인 기록용 블로그에서 현재 일평균 약 1500 정도의 기술블로그로 성장하였다. 티스토리에서 블로그를 운영하면 통계를 분석해주는데 항상 통계로 보여지는 방문자들의 데이터의 흐름이 신기하고 궁금했다. 구글 애널리틱스 GA4와 블로그를 연동하여 데이터를 쌓고, GA4와 BigQuery와 연동을 하면 데이터를 조작할 수 있다. 평소 궁금했던 블로그 방문에 대한 데이터를 직접 분석해려고 한다. 연동하기만 하면 쌓여있는 모든 데이터들을 다 볼 수 있는지 알았는데, 그건 아니고 연동한 시점부터 데이터를 쌓기 시작하여 이후 수집 데이터들을 다룰 수 있다. 때문에 해당 포스팅에서는 12/19일-25일, 즉 1주일 간 쌓인 데이터들을 대상으로 한다. 데이터 구..

Data Analytics 2023.01.18

[GA4-빅쿼리] 세션 재정의 해보기

구글 애널리틱스에서 제공하는 데이터를 빅쿼리에 연동해보면 사용자고유 아이디와 세션아이디를 제공해준다. 다음과 같은 여러개의 컬럼을 제공해주는데, 'user_pseudo_id'가 사용자가 이벤트를 발생시켰을때, 발생하는 인스턴스 아이디로 사용자 고유 아이디 값이고, 세션아이디는 컬럼에서 보이지 않는다. 데이터를 살펴보면 세션아이디값인 ga_session_id 는 event_params.key에 정의되어 있으며 그 값은 event_params.value.int_value에 존재하고 있다. 즉..... ARRAY 와 STRUCT 문법이 사용된 NESTED 한 구조로 존재한다. 우리에게 익숙한 컬럼으로 존재했으면 ga_session_id로 SELECT만 하면 될 일이지만 복잡한 데이터 구조로 상당한 고역이 예상..

eclipse-maven연동 m2e+wtp 사용시 ContextRoot 변경되는 문제 해결

이클립스과 메이븐 연동은 개발자에게 편리함을 제공한다. 하지만 .settings의 자동변화에 종종 삽질을 하게됨. 이번에 겪은 삽질은 Dynamic Web Projects와 M2E 통합으로 인해 메이븐 업데이트시, .settings/org.elipse.wst.common.component 파일의 의 값이 자동으로 변경된다는 점이다. ContextRoot 고정시키는 방법 이클립스 내에서 m2e-wtp플러그인을 사용하여 웹프로젝트를 관리할 때 다음과 같이 context root가 관리된다. 기본적으로 m2e-wtp는 maven-war-plugin환경에 정의된 값으로부터 독립된 웹 애플리케이션의 context root가 적용된다. maven-war-plugin 1.2 myWebapp 2. 설정에 값이 지정되어..

[SQL] 테이블 병합 MARGE

테이블 마이그레이션 작업에 많이 사용되는 테이블 머지 SQL문을 알아보자. 테이블 마이그레이션 작업이란 테이블1의 모든 데이터를 테이블 2로 옮기는 작업이라고 생각하면 된다. 1차로는 INSERT로 모든 데이터를 새 테이블이 넣어준다. 문제는 데이터의 변동이 없다면 INSERT로 덮어칠 수 있지만 데이터의 변동이 있는 경우 선별적으로 변동된 데이터만 업데이트 시켜주어야 하는 경우가 발생한다. 이런 경우에는 어떤 데이터의 변동이 있었는지 체크한 후, 데이터의 변동이 있는 컬럼만 UPDATE시켜주고, 새로운 데이터가 추가되었다면 INSERT 해 주어야 한다. IF 조건문을 통해 나누어 작업할 수도 있겠지만 이러한 작업을 한번에 해 주는 것이 MERGE 문이다. 비교-삽입-갱신 과정을 한번에 처리하는 것이다...

Back-end/DataBase 2023.01.10