• 검색 결과가 없습니다.

4. pandas 라이브러리1강. pandas 데이터프레임 함수

N/A
N/A
Protected

Academic year: 2022

Share "4. pandas 라이브러리1강. pandas 데이터프레임 함수"

Copied!
8
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

AI 개발을 위한 데이터 분석 및 시각화 04-1

4. pandas 라이브러리 1강. pandas 데이터프레임 함수

학습내용

- pandas 데이터프레임 함수 - 함수 구조 및 사용방법

학습목표

- 데이터분석용 함수로 pandas 데이터프레임을 생성할 수 있다.

- pandas 함수 구조를 활용하여 다양한 방법으로 사용할 수 있다.

1. pandas 데이터프레임 통계함수 1) 기본 문법

가. 데이터분석용 함수

- 리스트[ ]를 여러 개 묶어놓은 2차원 배열 생성

- array 데이터를 DataFrame에 넣어 컬럼과 인덱스 넣어줌 - 통계용 함수 사용하여 결과 분석

- Series는 index만 인수로 사용할 수 있음

나. 예제

(2)

2) 함수구조 및 사용방법 1) sum()

가. 특징

- 행, 열 방향에 따른 합계를 구하는 함수 - axis = 0을 주면 열의 합계를 구할 수 있음 - axis = 1을 주면 행의 합계를 구할 수 있음

나. 동작

(3)

AI 개발을 위한 데이터 분석 및 시각화 04-1

다. 예제

- 특정 열에 대한 합과 특정 행의 합도 구할 수 있음

2) mean() 가. 특징

- 행, 열 방향에 따른 평균을 구하는 함수 - axis = 0을 주면 열의 평균을 구할 수 있음 - axis = 1을 주면 행의 평균을 구할 수 있음 - 인덱싱 없이하며 각 열에 대한 통계량이 나옴 나. 예제

- 행의 평균을 구하려면 인자에 axis=1 넣어 실행 할 수 있음

(4)

다. 예제

- NaN 값을 무시하지안하고 평균도 NaN으로 처리시 skipna = False 대입

2) filllna() 가. 특징

- 누락값을 특정값으로 대체하는 기능 - 특정 텍스트, 평균값, 0, 최대값으로 대체

(5)

AI 개발을 위한 데이터 분석 및 시각화 04-1

나. 예제

- 행의 평균을 구하려면 인자에 axis=1 넣어 실행 할 수 있음

3) std() 가. 특징

- 행, 열 전체 성분의 표준 편차 계산하는 함수 - axis = 0(열), axis = 1(행)

나. 예제

(6)

4) min(), max() 가. 특징

- 행, 열 전체 성분의 최소값, 최대값을 계산 - axis = 0(열), axis = 1(행)

나. 예제

(7)

AI 개발을 위한 데이터 분석 및 시각화 04-1

5) count() 가. 특징

- 행, 열 전체 성분의(NaN이 아닌)값의 개수를 계산 - axis = 0(열), axis = 1(행)

나. 예제

6) 정리

함수명 설명

sum( ) 행, 열 전체 성분의 합을 계산

mean( ) 행, 열 전체 성분의 평균을 계산

min(), max( ) 행, 열 전체 성분의 최소값, 최대값을 계산 count( ) 행, 열 전체 성분의(NaN이 아닌) 값의 개수를 계산 std( ), var( ) 행, 열 전체 성분의 표준편차, 분산을 계산

argmin( ) 단일 열배열 성분의 최소값이 위치한 인덱스를 반환

(8)

평가하기

1. 다음 누락값(NaN)을 채우기 함수로 알맞은 것은?

① Max( )

② Min( )

③ fillna( )

④ Argmin( )

⑤ Count( ) - 정답 : ➂번

해설 : 누락값을 대체하여 채워주는 함수는 fillna( )입니다.

2. 다음 데이터분석용 통계함수가 아닌 것은?

① sum( )

② mean( )

③ var( )

④ float( )

⑤ std( ) - 정답 : ➃번

해설 : 데이터분석용 통계함수에는 sum(), mean(), var(), std(), count(), min(), max() 등이 있습니다.

학습정리

1. pandas 데이터프레임 통계함수 - 데이터분석용 데이터 프레임 생성 2. 함수 구조 및 사용방법

- sum(), mean(), var(), std(), min(), max()등 - fillna() NaN 값 채우기

참조