AI 개발을 위한 데이터 분석 및 시각화 04-1
4. pandas 라이브러리 1강. pandas 데이터프레임 함수
학습내용
- pandas 데이터프레임 함수 - 함수 구조 및 사용방법
학습목표
- 데이터분석용 함수로 pandas 데이터프레임을 생성할 수 있다.
- pandas 함수 구조를 활용하여 다양한 방법으로 사용할 수 있다.
1. pandas 데이터프레임 통계함수 1) 기본 문법
가. 데이터분석용 함수
- 리스트[ ]를 여러 개 묶어놓은 2차원 배열 생성
- array 데이터를 DataFrame에 넣어 컬럼과 인덱스 넣어줌 - 통계용 함수 사용하여 결과 분석
- Series는 index만 인수로 사용할 수 있음
나. 예제
2) 함수구조 및 사용방법 1) sum()
가. 특징
- 행, 열 방향에 따른 합계를 구하는 함수 - axis = 0을 주면 열의 합계를 구할 수 있음 - axis = 1을 주면 행의 합계를 구할 수 있음
나. 동작
AI 개발을 위한 데이터 분석 및 시각화 04-1
다. 예제
- 특정 열에 대한 합과 특정 행의 합도 구할 수 있음
2) mean() 가. 특징
- 행, 열 방향에 따른 평균을 구하는 함수 - axis = 0을 주면 열의 평균을 구할 수 있음 - axis = 1을 주면 행의 평균을 구할 수 있음 - 인덱싱 없이하며 각 열에 대한 통계량이 나옴 나. 예제
- 행의 평균을 구하려면 인자에 axis=1 넣어 실행 할 수 있음
다. 예제
- NaN 값을 무시하지안하고 평균도 NaN으로 처리시 skipna = False 대입
2) filllna() 가. 특징
- 누락값을 특정값으로 대체하는 기능 - 특정 텍스트, 평균값, 0, 최대값으로 대체
AI 개발을 위한 데이터 분석 및 시각화 04-1
나. 예제
- 행의 평균을 구하려면 인자에 axis=1 넣어 실행 할 수 있음
3) std() 가. 특징
- 행, 열 전체 성분의 표준 편차 계산하는 함수 - axis = 0(열), axis = 1(행)
나. 예제
4) min(), max() 가. 특징
- 행, 열 전체 성분의 최소값, 최대값을 계산 - axis = 0(열), axis = 1(행)
나. 예제
AI 개발을 위한 데이터 분석 및 시각화 04-1
5) count() 가. 특징
- 행, 열 전체 성분의(NaN이 아닌)값의 개수를 계산 - axis = 0(열), axis = 1(행)
나. 예제
6) 정리
함수명 설명
sum( ) 행, 열 전체 성분의 합을 계산
mean( ) 행, 열 전체 성분의 평균을 계산
min(), max( ) 행, 열 전체 성분의 최소값, 최대값을 계산 count( ) 행, 열 전체 성분의(NaN이 아닌) 값의 개수를 계산 std( ), var( ) 행, 열 전체 성분의 표준편차, 분산을 계산
argmin( ) 단일 열배열 성분의 최소값이 위치한 인덱스를 반환
평가하기
1. 다음 누락값(NaN)을 채우기 함수로 알맞은 것은?
① Max( )
② Min( )
③ fillna( )
④ Argmin( )
⑤ Count( ) - 정답 : ➂번
해설 : 누락값을 대체하여 채워주는 함수는 fillna( )입니다.
2. 다음 데이터분석용 통계함수가 아닌 것은?
① sum( )
② mean( )
③ var( )
④ float( )
⑤ std( ) - 정답 : ➃번
해설 : 데이터분석용 통계함수에는 sum(), mean(), var(), std(), count(), min(), max() 등이 있습니다.
학습정리
1. pandas 데이터프레임 통계함수 - 데이터분석용 데이터 프레임 생성 2. 함수 구조 및 사용방법
- sum(), mean(), var(), std(), min(), max()등 - fillna() NaN 값 채우기