ㅇ 오늘 목표
[오전] 개인 과제 마무리 & 제출
[오후] SQLD 준비
새로 배운 내용
# 기초 통계량 확인
iris.describe()
iris.describe([.25, .5, .75, .95, .99]) # percentile(분위수)를 추가 조정 가능
# pivot_table의 aggfunc을 명시하지 않는 경우, mean()이 기본값!
iris.pivot_table(values=['Sepal Length', 'Petal Length'], index='Species')
# apply와 agg의 차이 : 거의 유사하나 agg는 여러 개의 함수를 동시에 적용할 수 있다는 장점이 있음!
iris.groupby('Species').agg({
'Sepal Length': ['sum', 'mean', 'std'],
'Sepal Width': ['sum', 'mean', 'std']
})
# numpy의 where를 사용하는 방법 : np.where(조건, 참, 거짓)
iris['Sepal Size'] = np.where(iris['Sepal Length'] >= 5.0, 'Large', 'Small')
iris
ㅇ 다음 목표
[오전] 과제 정리, 프로젝트 준비
[오후] SQLD 준비
'회고 > 내배캠_데이터분석가_'24.04~08' 카테고리의 다른 글
[6주차] 프로그래밍 기초 주차 (1/5) (0) | 2024.05.20 |
---|---|
[5주차] 프로그래밍 기초 주차 (4/4) (0) | 2024.05.17 |
[5주차] 프로그래밍 기초 주차 (2/4) (0) | 2024.05.14 |
[5주차] 프로그래밍 기초 주차 (1/4) (0) | 2024.05.13 |
[4주차] 프로그래밍 기초 주차 (4/4) (0) | 2024.05.10 |