로운's 기술노트

[1주차] Mini Project (5/5)_ 발표회 본문

내배캠_데이터분석가_'24.04~08/회고

[1주차] Mini Project (5/5)_ 발표회

로운's 2024. 4. 19. 23:43

ㅇ TIL

 

이번 프로젝트는 조금 신기하다.

"~~에 대해 00시까지 생각해 보고 의견 나눠볼까요?" 하더니

모여서 우다다다 의견 취합 끝. 협의 끝. 

이렇다보니 사실 긴 시간 동안 회의도 몇 번 없었다.

당시엔 참 효율적이라고만 생각했는데, 프로젝트가 막상 끝나고 보니 조원들에 대해 아는 게 별로 없었다.

돌아보니 프로젝트만 사업계획서인게 아니라, 너무 목적지향적으로 효율적으로만 프로젝트를 진행했던 것 같다.

 

미니 프로젝트를 마치고, * KTP를 진행하다 보니 'KTP가 필요한 상황' 첫 번째에 이런 내용이 있었다.

  * KTP : Keep, Problem, Try의 약자로 회고 방법론 중 하나)

 

 

너무 우리의 상황과 같았다. 

분업이 효율적으로 확실하게 되는 것도 단점을 크게 체감하게 되었다.

(물론 다른 요인도 있겠지만) 특히 이번 프로젝트는 데이터분석가로서의 지식이나 스킬보다 아무래도 각자의 다양한 경험들이 많다 보니 더욱 두드러지게 나타난 현상이 아닐까 싶다.

정확하게 눈으로 확인 할 수는 없겠지만, 이번 프로젝트가 목적지향 95% + 관계지향 5% 였다면

다음 조 활동은 목적지향 80% + 관계지향 20% 정도로 목표하고자 한다.

 

 

좋았던 점도 있었다.

발표회를 해보니 프로젝트반 13개 조 중에 6개 조 정도가 우리와 같은 데이터셋을 선택했다.

우리처럼 운영적인 측면으로 접근한 조도 있지만, 신박한 방향으로 접근한 조가 정말 많아서 신선했다.

그래서 다시 열정을 불태워 정현님이 사용했던 피어슨 상관계수를 엑셀로 구해봤다(이게 엑셀로 되네?!!).

 

 

피어슨 상관계수두 변수 간의 선형적 관계의 강도와 방향을 측정하는 통계적 지표로 두 변수가 얼마나 밀접하게 관련되어 있는지를 나타내며, 일반적으로 '-1'에서 '1' 사이의 값을 갖는다.

  • 1에 가까운 값  : 두 변수 간에 강한 양의 선형 관계가 있음. 즉, 한 변수가 증가할 때 다른 변수도 증가.
  • -1에 가까운 값: 두 변수 간에 강한 음의 선형 관계가 있음. 한 변수가 증가할 때 다른 변수는 감소.
  • 0에 가까운 값: 두 변수 간에 선형 관계가 거의 없거나 매우 약한 관계가 있음.

피어슨 상관계수는 두 변수가 선형 관계에 있을 때 유용하며, 변수 간의 비선형 관계를 측정하기에는 적합하지 않을 수 있다. 또한, 상관관계는 인과 관계를 나타내지 않으며, 두 변수 간의 관련성만을 보여준다.

 

쉽게 생각하면 상관계수로 나타난 값이 1에 가까우면 두 변수가 '정비례'하고, -1에 가까우면 '반비례', 0에 가까우면 '거의 무관'하다는 듯 하다.

엑셀에서 상관계수를 구하는 함수는 2가지가 있다.

=PEARSON(첫 번째 변수 범위, 두 번째 변수 범위)

=CORREL(첫 번째 변수 범위, 두 번째 변수 범위)

<품목별 1~12월의 할인율과 순이익의 상관계수>

 

보통 0.7 이상의 강한 양의 상관관계라고 하는데, (Machines을 제외한) 하위 품목들이 대부분 선형관계가 없거나 매우 약한 관계에 있음에도 총합계가 0.79가 나왔다. 흠 뭐지..

 

상관관계는 인과를 나타내지 않으나, 회귀분석은 인과를 나타낸다는 말을 들었다.

분석 툴이 아닌데 엑셀로 이게 가능할까?

 

< 품목별 1~12월의 할인율과 순이익의 회귀분석>

 

엑셀 만세!!!!! 

 

 

 

 

 

 

근데.. 다 좋은데, 해석은.....?

일단 엑셀에서 다양한 분석이 가능한 것을 확인했으니 다음 달에 기초통계 시간에 배워서 해석해 봐야지.

 

진짜 궁금했던 할인율과 순수익의 회귀분석 박제!

<주별 discount와 profit의 회귀분석>

 

 

오늘의 결론 

엑셀은 위대했다.

 

 

 

 

 

 

 

 

Comments