Every lesson I learn today

배운 것을 차곡차곡 기록하는 주니어 기획자의 아카이브

데이터 11

[책] 그로스해킹

[11번가] 그로스 해킹 /데이터와 실험을 통해 성장하는 서비스를 만드는 방법 카테고리: 쇼핑몰/인터넷비즈니스, 가격 : 13,500원 www.11st.co.kr 그로스해킹이란? - "크로스펑셔널한 직군의 멤버들이 모여서 핵심지표를 중심으로 실험을 통해 배움을 얻고, 이를 빠르게 반복하면서 제품이나 서비스를 성장시키는 것" - "그로스해킹은 핵심 지표를 찾고, 그 지표를 성장시키는 방법을 찾는 활동이라고 할 수 있다." 전통적으로 제품을 만드는 과정 '기획-생산-판매'에서의 성공 방정식은 유효하지 않다. 많은 시간과 노력을 투자해서 만든 제품이 알고 보니 아무도 원하지 않는 제품이라는 점을 뒤늦게 발견하는 것만큼 나쁜 일은 없다. '아이디어-개발-측정-개선'으로 이어지는 피드백 순환고리를 최대한 빨리 진..

데이터 2022.04.23

[책] 데이터 과학을 위한 통계

극단값 - 로버스트 : 극단값들에 민감하지 않다는 것을 의미한다. (유의어 : 저항성이 있다 resistant) - 절사평균 : 극단값의 영향을 제거한 평균 표본추출 - 다양한 데이테를 효과적으로 다루고 데이터 편향을 최소화하기 위한 방법으로 쵸본추출의 필요성이 더 커지고 있다. - 방법 ex. 복원추출, 비복원추출, 랜덤표본추출, 층화표본추출, 단순랜덤표본... 부트스트랩 - 통계량이나 모델 파라미터(모수)의 표본분포를 추정하는쉽고 효과적인 방법은, 현재 있는 표본에서 추가적으로 표본을 복원추출하고 각 표본에 대한 통계량과 모델을 다시 계산하는 것이다. 이러한 절차를 부트스트랩이라 하며, 데이터나 표본통계량이 정규분포를 따라야 한다는 가정은 꼭 필요하지 않다. - 개념적으로, 부트스트랩은 원래 표본을 ..

데이터 2021.06.26

[강의] 100 Days of Code - The Complete Python Pro Bootcamp for 2021

100 Days of Code - The Complete Python Pro Bootcamp for 2021 Master Python by building 100 projects in 100 days. Learn to build websites, games, apps, plus scraping and data science www.udemy.com 요즘 새롭게 공부하고 있는 파이썬 강의! 스터디원들이랑 일주일에 DAY3 분량씩 듣고 있는데 너무 알차고 재밌다. [장점] - 선생님이 너무 잘 가르쳐줌 - 기초부터 차근차근 난이도가 올라감 - DAY 마지막마다 exercise가 있는데 적당히 어렵고 흥미로움 - 엄청나게 자세하게 알려줘서 파이썬 초보자가 배우기 딱 좋음 - 중간중간에 알고리즘이나 CS에 관한..

데이터 2021.04.29

[책] 데이터 분석을 위한 SQL 레시피

이 책은 SQL스터디를 계획하시고 있는 분에게 적합한 책이다. 왜냐하면 혼자하기엔 좀 어렵고 내용도 많기 때문에 스터디로 공부하기에 딱 좋다. 기획직무 현직자 4명과 이 책으로 스터디를 진행해보니, 일주일에 한번씩 모여서 공부하니 약 5개월안에 이 책을 한바퀴 다 끝낼 수 있었다. 한바퀴 공부해보니, 확실히 SQL쿼리 작성하는게 수월해졌다. 다양한 함수를 알게 되니, 업무할 때 필요한 상황에 맞춰서 효율적으로 쿼리를 작성할 수 있게 되었다. 장점 : - 책에 소개된 쿼리들이 실무할 때 많이 쓰이고 유용하다 (그래서 학생보단 현직자한테 적합함.) - 일주일에 1.5강씩 하면 대략 4개월 안에 끝나는 분량이라 스터디 하기 딱 적당함 - Hive, 빅쿼리, my SQL 등 다양한 버전별 쿼리가 다 작성되어있음..

데이터 2021.04.29

[SQL] 사이트 내의 사용자 행동 파악하기

데이터 분석을 위한 SQL 레시피 p.343 ~ p.371 1. 입구페이지와 출구페이지 파악하기 -- 입구페이지 FIRST_VALUE(path) OVER( PARTITION BY session ORDER BY stamp ASC ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING ) AS landing --출구페이지 LAST_VALUE(path) OVER( PARTITION BY session ORDER BY stamp ASC ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING ) AS exit order by를 지정한 경우의 윈도 함수 파티션은 디폴트로 첫 행부터 현재 행까지임 ROWS에 대한 조건값이 있..

데이터 2021.02.08

[SQL] 여러개의 값에 대한 조작 (HIVE 기준)

FROM_UNIXTIME 이 함수는 유닉스 타임시간을 YYYY-MM-DD HH:MM:SS(또는 YYYYMMDDHHMMSS.uuuuuu) 로 반환 SELECT FROM_UNIXTIME(unix_timestamp); SELECT FROM_UNIXTIME(unix_timestamp, format); SELECT FROM_UNIXTIME(13191184471); -> 2011-10-20 22:47:48 SELECT FROM_UNIXTIME(UNIX_TIMESTAMP()); -> 2011-10-20 22:47:48 SELECT FROM_UNIXTIME(UNIX_TIMESTAMP())+0; -> 20111020224748.000000 SELECT FROM_UNIXTIME(UNIX_TIMESTAMP(), '%Y (%..

데이터 2020.11.22

[SQL] 하나의 값 조작하기

1. 코드 값을 레이블로 변경하기 SELECT user_id , CASE WHEN register_device = 1 THEN '데스크톱' WHEN register_device = 2 THEN '스마트폰' WHEN register_device = 3 THEN '애플리케이션' ELSE '' END AS device_name FROM mst_users ; 2. 현재 날짜와 타임스탬프 추출하기 SELECT CURRENT_DATE AS dt , CURRENT_TIMESTAMP AS stamp -- current_date (), current_timestamp() 인 경우도 있음 ; 3. 지정한 값의 날짜/시각 데이터 추출하기 SELECT CAST('2020-10-02' AS date) AS dt ,CAST('2..

데이터 2020.10.02