로운's 기술노트

[5주차] 프로그래밍 기초 주차 (3/4) 본문

내배캠_데이터분석가_'24.04~08/회고

[5주차] 프로그래밍 기초 주차 (3/4)

로운's 2024. 5. 16. 23:48
ㅇ 오늘 목표
[오전] 개인 과제 마무리 & 제출
[오후] SQLD 준비  

 

 

새로 배운 내용

# 기초 통계량 확인
iris.describe()
iris.describe([.25, .5, .75, .95, .99])		# percentile(분위수)를 추가 조정 가능

# pivot_table의 aggfunc을 명시하지 않는 경우, mean()이 기본값!
iris.pivot_table(values=['Sepal Length', 'Petal Length'], index='Species')

# apply와 agg의 차이 : 거의 유사하나 agg는 여러 개의 함수를 동시에 적용할 수 있다는 장점이 있음!
iris.groupby('Species').agg({
    'Sepal Length': ['sum', 'mean', 'std'],
    'Sepal Width': ['sum', 'mean', 'std']
})

# numpy의 where를 사용하는 방법 : np.where(조건, 참, 거짓)
iris['Sepal Size'] = np.where(iris['Sepal Length'] >= 5.0, 'Large', 'Small')
iris

 

 

ㅇ 다음 목표
[오전] 과제 정리, 프로젝트 준비
[오후] SQLD 준비  

 

Comments