[SQL/BigQuery] 앱 로그 데이터, ARRAY 에 대한 기초 이해 (Section 2-1)
·
데이터베이스 DB/BigQuery
💻본 포스팅은 [인프런] 카일스쿨의 BigQuery(SQL) 활용편을 기반으로요약 및 실습한 기록을 정리했습니다. 1. 앱 로그 데이터에서 Event 란?Event : 사용자가 하는 행동(클릭, 페이지, VIEW 등)시스템 이벤트, 오류 역시 Event에 포함하나의 이벤트를 설명해주는 Event parameter(Key)와 Event parameter value(Value) 역시 존재함 예시 : 사용자가 순살 치킨 너겟을 선택하고 카트에 담기를 누른 상황page : food_detail (event가 일어난 화면 표시)event_name : cart_click (카트에 담기 버튼을 클릭) => Eventfood_select : 순살 치킨 너겟여기서 food_select는 cart_click 이라는 Ev..
[SQL/BigQuery] BigQuery, SQL을 통한 업무 플로우 이해(Section 1)
·
마케팅 Marketing
💻본 포스팅은 [인프런] 카일스쿨의 BigQuery(SQL) 활용편을 기반으로 요약 및 실습한 기록을 정리했습니다.1. 업무 간 SQL의 활용 과정어떤 일을 해야한다.원하는 것을 정한다.데이터 탐색단일 자료 / 다량의 자료 : 다량의 자료일 경우 연결(JOIN) 과정데이터 처리 과정 조건 : SELECT, WHERE 등추출 : 문자열 등변환 : 원하는 형식으로 변환요약 : GROUP BY 등데이터 결과 검증 : 매우 중요하지만, 실무 경험이 없는 사람들은 간과하는 영역, 실제 분석 프로젝트에서도 데이터 정합성 검증을 하듯이, 쿼리문의 결과에 대해서도 검증 과정이 필수적이다.피드백 및 활용2. Query문 기초 문법WITH절 (중요)SELECJOINWHEREGROUP BY HAVINGORDER BY LI..
[Project] Valorant(발로란트) 선수비 vs 선공격 어느 쪽이 유리할까? (EP. 2 : 데이터 수집처 실종)
·
개인 프로젝트 (Project)/Valorant 유저 데이터 분석
이전 포스팅2025.11.26 - [공부/Projects] - [Toy Project] Valorant(발로란트) 선수비 vs 선공격 어느 쪽이 유리할까? (EP. 1 : 프로젝트 소개) [Toy Project] Valorant(발로란트) 선수비 vs 선공격 어느 쪽이 유리할까? (EP. 1 : 프로젝트 소개)최근에 분석 공모전 1개가 끝난 관계로 평소에 궁금했던 내용에 대해 토이 프로젝트를 진행하고자한다.예상기간 : 2주 ~ 1개월 (취준때문에 일정이 애매모호하다)1. 프로젝트 개요프로젝트 명 :castle1data.tistory.com데이터 수집 설계 과정부터 문제가 발생했다..1. 데이터 수집처 실종처음 계획으로는 발로란트 API를 통해서 매치 데이터를 수집 할 계획이어서 라이엇 API 서비스를 통..
[Project] Valorant(발로란트) 선수비 vs 선공격 어느 쪽이 유리할까? (EP. 1 : 프로젝트 소개)
·
개인 프로젝트 (Project)/Valorant 유저 데이터 분석
최근에 분석 공모전 1개가 끝난 관계로 평소에 궁금했던 내용에 대해 토이 프로젝트를 진행하고자한다.예상기간 : 2주 ~ 1개월 (취준때문에 일정이 애매모호하다)1. 프로젝트 개요프로젝트 명 : 발로란트 선수비 vs 선공격 어느 쪽이 유리할까?선정 배경 : 평소 시간 날때마다 발로란트 내전을 즐겨하는데, 선수비와 선공격을 고를 수 있는 기회가 주어지면 대부분의 사람들은 선수비를 선택함.이를 바탕으로, 선수비와 선공격의 승률을 비교해봤더니 선수비 측이 70%의 승률을 보여줌이것이 내가 하는 내전에 한정적인 것인지, 실제로 심리적인 영향이 있는 것인지 알아보고자함.관련 내용 : 승리 추세가 게임에 영향을 주는가?https://www.quora.com/Is-there-a-statistically-signific..
[DA] 이상치(Outlier)를 다루는 방법 / 제거만이 답일까?
·
데이터 분석/통계 이론
포트폴리오를 재구성하면서, 이전에 진행했던 다양한 프로젝트를 살펴보고 분석 흐름에 대해서 살펴보았다.눈에 띈 부분 중 하나는, 이상치에 대한 처리방법이다. 어떤 프로젝트에서는 확신의 제거를 하기도 했고, 어떤 프로젝트에서는 그냥 품고 진행하기도 했다. 실무에서 이상치에 대한 정확한 처리법은 어떻게 될까?1. 이상치(Outlier)란?이상치(Outlier)는 데이터 셋 안에서 다른 값들과 크게 동 떨어진 값인데, 이상치의 정의 또한 데이터마다 다르게 이루어진다. 직접 진행한 프로젝트 내에서 설명해보자면,1. 날씨에 따른 유동인구 변동을 조사할 때, 강수량이 음수(-)인 경우 : 이런 경우는 대체로 측정이나 표기 오류로 확실한 이상치라고 할 수 있다.2. 하루 평균 40건 내외의 따릉이 대여가 발생하는 대여..
[SQL] DB의 입장에서 효율적인 쿼리문 작성 방법 (쿼리 최적화)
·
데이터베이스 DB/코딩테스트
💡 효율적인 SQL 쿼리 작성법과 최적화 전략SQL을 꾸준히 공부하다 보면 단순히 “정답 쿼리를 작성하는 것”보다, 더 빠르고 효율적인 쿼리를 작성하는 것, 즉 쿼리 최적화(Query Optimization)에 대한 언급을 이따금씩 본다. 하지만, 대부분 SQL 테스트들은 효율성보다는 정답과 같은 답을 뽑아낼 수 있는지에 초점이 맞추어져있다.오늘 나는 쿼리 최적화가왜 필요한지?그리고 어떻게 이루어 낼 수 있는지 간단히 알아보았다. 💡 쿼리 최적화의 목표 1. 성능 향상2. 응답시간 단축3. 시스템 자원의 절약- CPU, 메모리, 네트워크 트래픽등의 절감 가능 -> 서버 확장 비용 절감4. 유지보수성 향상 : 협업 단계에서 매우 중요💡 쿼리 최적화 방법🧩 1. 효율적인 조건 설정 – 테이블 크기 줄..