회고/내배캠_데이터분석가_'24.04~08

[1주차] Mini Project (1/5)_ 가설 설립 & 전처리

로운's 2024. 4. 16. 08:55

ㅇ Role

: 팀 구성은 총 5인으로 '의사결정자(팀장)', '프로젝트 매니저', '기록담당자', '기술담당자', '연결담당자'로 분화

의사결정자
  팀장, 초안 영상 촬영
지희님
프로젝트 매니저
  전체적인 프로젝트 일정 및 진행도 체크
Me
기록담당자
  구글 docs, 노션 등 팀 문서 작성 및 관리
정현님
기술담당자
  SQL, Python 등 기술 관련 팀원 도움
민준님
연결담당자
  프로젝트 최종 발표
민주님

 

ㅇ 기간

: 2024.04.15(월) ~ 2024.04.19(금)

 

ㅇ 자료

: kaggle 內, 미국 전자상거래 관련 건

  * United States E-Commerce records 2020 (kaggle.com) 

 

ㅇ 진행 방향

1. 분석 목적 : 목적과 목표를 설정하여 분석 방향성을 설정
    - 프로젝트 개요 : 왜 이 프로젝트를 수행하는지 간단히 설명
    - 목적과 목표 설정 : 예상되는 결과에 대한 간략한 언급
2. 데이터 수집 : 데이터를 수집하는 과정데이터 형식 설명
     - 데이터 수집 방법 : 어디서 데이터를 얻었는지 설명 
     - 데이터 형식 설명 : 데이터가 어떤 형태인지 간단히 소개
     - 데이터 수집 과정 : 데이터 수집 과정에서의 어려움 및 해결책
3. 데이터 전처리 : 데이터를 이해하고 분석에 필요한 형태로 가공
     - 결측치 처리 : 누락된 정보가 있는지 확인하고 채우기
     - 이상치 탐지 및 처리 : 이상한 값을 찾아서 수정
     - 데이터 정규화 & 표준화 데이터를 이해하기 쉽게 변환하기
4. 데이터 분석 : 분석 목적과 방향성에 맞게 분석 실행
     - 기초 통계량 분석 : 분석 방향성에 맞게 통계 설정
     - 시각화를 통한 데이터 탐색 : 간단한 그래프나 표를 통해 데이터를 시각화
     - 변수 간 상관 관계 분석 : 데이터 간의 연관성 찾기
5. 결과 해석 : 해석 후 인사이트 도출 및 추후 방향성 제시
     - 해석 및 인사이트 도출 : 결과를 어떻게 해석할 수 있는지 소개
     - 개선 및 분석 방향성 : 추가 개선 사항 및 추후 분석 방향
6. 결론 : 주요 결과 요약 및 한계점 & 개선 사항 설명
     - 프로젝트 요약 : 프로젝트의 주요 결과를 간단히 요약
     - 한계점과 개선 사항 : 결과에서 한계점과 개선 사항을 설명
     - 추후 분석 및 발전 방향 : 발전 가능성을 제시하여 방향성을 설정
7. 참고 자료 : 도움이 된 자료 또는 참고한 웹페이지 링크
     - 참고 자료 목록 : 사용한 논문, 서적, 웹 사이트 등의 참고 자료

 

ㅇ TIL

Dbeaver에 csv파일을 import시키는데, 처음이라 애를 많이 먹었다.

도중 각종 에러가 발생하였는데, 구글링해도 파이썬과는 다르게 자료가 많지는 않은 느낌이었다. 역시 생태계의 중요성을 다시금 깨닫는다. 대표적으로 '데이터 형태 불일치(varchar로 해결)', '203자 초과(수기로 수정하여 해결)' 등이 있었다.

 

첫날인만큼 새로운 조원들과 세부 타임테이블 조율과 역할, 방향 등을 협의했다.

그 중 주제는 자유/선택주제 중, 전자상거래가 결정되었다.

사실- 매출 증대라는 결론 도출방향이 너무 뻔하기도 했고

이전 업무 양식이 생각나서 피하고 싶었다 ㅋㅋㅋ (다음 프로젝트에선 꼭 다른 주제를 해보고 싶다)

결국_ 주전부리를 먹으며 데이터를 파보다가 시계를 보니 새벽 3시였다.

오늘도 야근이구나... (내일은 쿼리와 더 친해져야겠다)