Python+numpy pandas 3편

Moon Yong Joon
1
Python
numpy,
pandas
기초-3편

6. Pandas 모듈 기초
7. Pandas Series/ DataFrame
기초
8.Pandas series/dataframe
공통메소드
9. Pandas index class
10.Pandas groupby 처리
11. Pandas panel(3차원)
목차
2

PANDAS 데이터 타입 구조
5

1차원의 데이터를 관리하는 컨테이너이면 dict 타
입처럼 index와 value가 항상 연계되어 처리
6
Series 구조 : 1차원
index
0
1
2
data: 실제 데이터 값
index : 데이터를 접근할 정보
index.name으로 index도
name을 지정할 수 있음
dtypes : 데이터들의 타입
name : Series 인스턴스의 이름
values
dtypes

1차원의 데이터를 관리하는 컨터이너이며 index
등을 별도로 정의할 수 있음
7
Series 구조 생성

Series 인스턴스들이 DataFrame의 칼럼으로 들
어가는 구조 columns는 series 명이 되어야 하고
index는 series의 index로 처리
8
DataFrame 구조: 2차원
Index(행)
Column(열)
col1 col2 col3
row1row2row3
index
0
1
2
values
dtype
name
index
0
1
2
values
dtype
name
index
0
1
2
values
dtype
name
Series에서
DataFrame
전환

n*m 행렬구조를 가지는 데이터 구조이고 index
와 column이 별도의 명을 가지고, column별로
다른 데이터 타입을 가질 수 있음
9
DataFrame 생성
Index(행)
Column(열)
col1 col2 col3
row1row2row3

3차원의 데이터를 관리하는 컨테이너
10
Panel 구조 : 3차원
index
item0
item1
data
Index(행)
Column(열)
col1 col2 col3
row1row2row3
DataFrame
Index(행)
Column(열)
col1 col2 col3
row1row2row3
data = {'Item1' : pd.DataFrame(np.random.randn(3, 3)),
'Item2' : pd.DataFrame(np.random.randn(3, 3))}
pd.Panel(data)

[ ] 연사자 내의 숫자는 마지막을 포함하지 않지
만 문자일 경우 마지막 값도 처리
12
슬라이싱 처리시 숫자와 문자
[0,0] [0,1] [0,2]
Row : 행
Column: 열
0
0 1 2
[0,0] [0,1] [0,2]
Column: 열
0
a b c
숫자로 조회 문자로 조회

[ ] 연산자로 원소값(scalar) 및 일차원(Series) 조
회
13
원소값, 일차원
[0,0]
Row : 행
Column: 열
[0,0] [0,1] [0,2]
Row : 행
Column: 열
0
0 1 2

[ ] 조회로 2차원과 3차원 조회
14
2차원/3차원
[0,0] [0,1] [0,2]
[1,0] [1,1] [1,2]
[2,0] [2,1] [2,2]
Row : 행
Column: 열
0
1
2
0 1 2

labels, names으로 분리해서 접근할 수 있는 정보
를 관리
16
Index에 대한 객체화
Index(행)
Column(열)
col1 col2 col3
row1row2row3
labels
names
Index에 대한 위치관리
Levels에 대한 명
labels
names
Column 에 대한 위치관리
Index(행) Column(열)

Levels, labels, names으로 분리해서 접근할 수 있
는 정보를 관리
17
multiIndex에 대한 객체화
Index(행)
Column(열)
col1 col2 col3
row1row2row3
levels
labels
names
Index에 대한 이름관리
Index에 대한 위치관리
levels
labels
names
Column 에 대한 이름관리
Column 에 대한 위치관리
Index(행) Column(열)
row1row2row3
col1 col2 col3

1차원의 데이터를 관리하는 컨테이너
20
Series 구조
pandas.Series(data,index,dtypes,name,copy)

List를 받아서 Series 인스턴스를 생성
22
Series생성 : list-like

dict를 받아서 키는 index, 값은 values로 저장되
는 Series 인스턴스를 생성
23
Series생성 : dict-like

Series는 value 값을 ndarray와 index를 Index 타
입으로 구성
24
Series 내부 data type

Index에도 name 속성이 존재해서 index 내부의
name 부여
26
Series생성 :index에 name 부여

Index가 없을 경우 RangeIndex, 숫자로 index 부
여하면 Int64Index, 문자는 Index 타입으로
28
Series 조회 : index
Index가 숫자나
문자로 검색이 가
능함

숫자는 RangeIndex, 문자는 Index 타입으로 관리
하여 index 값으로 슬라이싱도 조회
29
Series 조회 : slice
문자로 slice 할
때는 해당표시
하는 것까지
포함되어 처리
됨

논리식으로 처리하면 True/False 원소로 리스트
가 생성되이 이 중에 True 인 것만 검색
31
Series 조회 : 논리식

Fancy 접근처럼 [ ] 내부에 리스트로 index 정보
를 주고 검색이 가능
32
Series 조회 :fancy 방법

n*m 행렬구조를 가지는 데이터 구조 생성
35
DataFrame 생성
class DataFrame(pandas.core.generic.NDFrame)
| 2차원 행렬
| Parameters
| ----------
| data : numpy.ndarray ,dict, or DataFrame
| dict can contain Series, arrays, constants, or list-like objects
| index : Index or array-like
| 행에 대한 정보 기본은 np.arange(n), 명칭도 부여 가능
| columns : Index or array-like
행에 대한 정보 기본은 np.arange(n), 명칭도 부여 가능
| dtype : dtype, default None
| Data type to force, otherwise infer
| copy : boolean, default False
| Copy data from inputs. Only affects DataFrame / 2d ndarray input

Series로 DataFrame를 생성하고 하나의 칼럼을 조회
해 보면 Series 타입으로 조회 되고 DataFrame의
values는 ndarray으로 2차원으로 관리
36
DataFrame 내부 data type

DataFrame 는 value 값을 ndarray와 index를
Index 타입으로 구성
37
DataFrame 내부 data type

DataFrame은 기본적으로 column 단위로 데이터
를 관리함
39
DataFrame 생성: 1 column
행
열
col1
row1row2row3

column단위로 리스트를 만들어서 zip을 이용해
서 순서쌍을 만들고 데이터를 생성
40
DataFrame 생성: list/tuple

column단위로 리스트를 만들어서 dict에 대입해
서 데이터를 생성하면 key가 columns 명으로 들
어감
41
DataFrame 생성: dict

DataFrame 정의시 columns 정의한 순서대로 저
장됨
42
DataFrame 칼럼 추가: 순서

SERIES를 이용해서 생성
43

series로 dataframe을 생성하면 series index는 행
(index)으로 가고 series name은 열(column)로 표시
44
Dataframe : Series 1개로 생성

series를 list로 dataframe을 생성하면 series
index는 칼럼으로 가고 series name은 index로 표
시
45
Dataframe : list(Series)
List로 생성시 행과
열이 바뀌므로 주의
해야 함

series를 dict으로 dataframe을 생성하면 series
index는 index으로 가고 series name은 columns
로 표시
46
Dataframe : dict(Series) 1

series를 dict으로 dataframe을 생성하면 series
index는 index으로 가고 series name은 columns
로 표시
47
Dataframe : dict(Series) 2

series를 dict comprehension을 이용해서
dataframe을 생성하면 series index는 index으로
가고 series name은 columns로 표시
48
Dataframe : dict comprehension

Index의 원소는 변경이 불가하지만 전체를 대체
할 수 있음
50
DataFrame index 대체

DataFrame은 기존에 행에 이름을 부여(index 속
성)
51
DataFrame : index 이름 부여
행
열
col1
row1row2row3
col2

DataFrame은 기본적으로 column 명을 추가를
할 수 있지만 실제는 칼럼명이 대체되는 것
52
DataFrame : column 명 변경
행
열
col1
row1row2row3

DataFrame.칼럼명으로 조회하면 칼럼단위로 조
회가 가능
54
DataFrame 칼럼명으로 조회

DataFrame은 기존에 행에 이름을 부여(index 속
성)
55
DataFrame 행 이름 부여
행
열
col1
row1row2row3
col2

객체의 속성에 접근하는 것처럼 칼럼이름을 속성
으로 표시해서 접근해 데이터 검색
56
DataFrame 접근: 속성형식 조회

DataFrame은 단일 열을 인덱스 방식([ ])
57
DataFrame 검색 : column
행
열
col1
row1row2row3
col2

DataFrame은 멀티 열은 슬라이스 방식([ [ , ] ])
을 사용하지만 칼럼명을 리스트로 작성해서 검색
58
DataFrame 검색 : multi column
행
열
col1
row1row2row3
col2

DataFrame 내의 논리식을 표현하면 True 일 경
우 출력됨
60
DataFrame 조회 : 논리식

[[“칼럼 위치”]]로 조회하면 칼럼 기준으로 접근
해서 데이터 검색
62
DataFrame 접근: 칼럼위치

여러 개의 칼럼([[칼럼위치]])을 기준으로 접근해
서 데이터 검색
63
DataFrame 접근: 여러개 칼럼위치

64
Pandas 함수 및 메소드 처리

동일 규칙 함수나 메소드 지원
65

Pandas도 메소드가 동일 이름으로 class마다 정
의되어있고 처리 방식도 유사
66
동일 메소드 지원
Series class
메소드
DataFrame class
메소드

Series이 index 범위가 벗어나면 KeyError 발생
67
Series 조회 : No Index

Series이 index 범위가 벗어나도 KeyError 발생
하지 않으려면 get() 메소드를 사용해서 index 범
위를 초과할 경우 사용
68
Series 조회 : get() 메소드

DataFrame 이 index 범위가 벗어나면 KeyError
발생
69
DataFrame 조회 : No Index

DataFrame 이 index 범위가 벗어나도 KeyError
발생하지 않으려면 get() 메소드를 사용해서
index 범위를 초과할 경우 사용
70
DataFrame 조회 : get() 메소드

Serise와 DataFrame의 색인은 view를 보여주므
로 별도의 복사본이 필요한 경우 반드시 copy해
서 사용
72
복사본을 만들고 갱신처리

copy 메소드를 이용해서 생성하면 다른 인스턴스
가 생성되지만 값을 비교(==)와 인스턴스비교(is)
는 다른 결과가 나옴
73
Series 카피 후 생성 : copy

copy 메소드를 이용해서 생성하면 다른 인스턴스
가 생성되지만 값을 비교(==)와 인스턴스비교(is)
는 다른 결과가 나옴
74
DataFrame카피 후 생성 : copy

하나의 칼럼을 기준으로 group화해서 칼럼들에
대한 연산 처리
76
Groupby
letter one two
0 a 1 2
1 a 1 2
2 b 1 2
3 b 1 2
4 c 1 2
one two
letter
a 2 4
b 2 4
c 1 2
letter one two
0 a 1 2
1 a 1 2
2 b 1 2
3 b 1 2
4 c 1 2
two
letter one
a 1 4
b 1 4
c 1 2

Apply 메소드는 내부 함수를 모든 원소에 대해 계
산을 처리함
78
Dataframe 모든 원소에 적용
Index(행)
Column(열)
col1 col2 col3
row1row2row3
df.apply(func)
Apply 메소드
func(df 원소값)을 넣어 전체 값
을 전환
Index(행)
Column(열)
col1 col2 col3
row1row2row3

Series로 matplotlib 그래프 그리기
81
Series

DataFrame로 matplotlib 그래프 그리기
82
DataFrame

83
7. Pandas Series/
Dataframe 기초

Index는 index, 원소는 values에 보관됨
85
Series 구조 속성 1
변수 설명
name Series 인스턴스에 대한 이름
shape DataFrame의 행렬 형태를 표시
dtypes 행과 열에 대한 데이터 타입을 표시
ndim 차원에 대한 정보 표시
strides 데이터를 구성하는 총 갯수
index 생성된 행에 대한 index 표시
values 실제 data를 Numpy 로 변환

원소의 개수는 타입 등 추가 정보를 보관
86
Series 구조 속성 2
변수 설명
size 원소들의 갯수
ftypes
Return the ftypes (indication of sparse/dense and
dtype) in this object.
axes 행과 열에 대한 축을 접근 표시
empty 내부가 없으면 True 원소가 있으면 False
base
기본 데이터의 메모리를 공유하는 경우에는 기본
객체를 반환

Axes(축)은 Index클래스에 대한 정보를 가지고
있고, index(0)에 대한 labels구성에 대한 축을 관
리
87
attribute : axes

88
Series 변환 속성 3
변수 설명
T 행과 열을 변환

blocks, ix, iat,at,iloc,loc 등 다양한 접근 방안을
제공
91
Series 내부 view 제공

Series 인스턴스를 dict 타입으로 변환처리
93
Series 구조 변환: blocks
dtypes
index
0
1
2
values
Key
(dtype)
Value
(Series)
Series
Series를
dict로
전환

주요 Series 인스턴스의 값을 접근하기 위해 ix 객
체를 제공하고 label, index로 접근이 가능
95
Series 접근 : ix

개별 원소별로 접근해서 처리
96
Series 접근 : ix 원소별 접근

Slicing 접근시 index가 문자일 경우는 문자가 해
당하는 위치까지 포함
97
Series 접근 : ix slicing 접근

SERIES 내부 VIEW : 기타
98

주요 Series 인스턴스의 값을 접근하기 위해 at은
레이블,iat은 인덱스로 처리해서 값을 검색
99
Series 접근 : at/iat

주요 Series 인스턴스의 값을 접근하기 위해 loc
는 값과 슬라이싱 처리를 포함해서 검색, 칼럼명
으로 조회시는 마지막도 검색됨
100
Series 접근 : loc/iloc

이름과 생일을 한쌍을 만들어서 dataframe으로
생성
103
DataFrame 생성
Index(행)
Column(열)
col1 col
2
row1row2row3

Index, columns, shape에 대한 정보 조회
104
attribute : Index, columns, shape
변수 설명
shape DataFrame의 행렬 형태를 표시
index 행에 대한 접근 표시
columns 칼럼에 대한 접근 표시

dtypes, at(indexing/slicing), ndim에 대한 속성
값들을 확인
105
attribute : dtypes, ndim
변수 설명
ndim 차원에 대한 정보 표시
dtypes
행과 열에 대한 데이터 타입
을 표시

empty, ftypes에 대한 속성 값들을 확인
106
attribute : empty, ftypes
변수 설명
ftypes
Return the ftypes (indication of sparse/d
ense and dtype) in this object.
empty
DataFrame 내부가 없으면 True 원소가
있으면 False

size, values, T에 대한 속성 값들을 확인
107
attribute : size, values, T
변수 설명
size 원소들의 갯수
values Numpy 로 변환
T 행과 열을 변환

Axes(축)은 Index클래스에 대한 정보를 가지고
있고, index(0)/ columns(1)에 대한 labels구성에
대한 축을 관리
108
attribute : axes

109
DataFrame 내부구조 검색

DataFrame의 blocks 속성에 가지고 있는 정보를
검색
111
DataFrame.blocks

DataFrame의 blocks 속성에 정의된 타입을 기준
으로 칼럼 정보를 검색
112
DataFrame.blocks 내부 조회

ix로 내부 값을 조회
114
DataFrame.ix

DataFrame의 ix는 숫자로 내부의 series와 값을
조회
115
DataFrame.ix 조회

DataFrame은 ix 속성을 이용해서 행과 열을 동
시에 검색 ([ 행(슬라이싱 : ), 칼럼(명) ])
116
DataFrame 행과열 검색 1
행
열
col1
row1row2row3
col2

DataFrame은 ix 속성을 이용해서 행과 복수의
열을 동시에 검색 ([ 행(슬라이싱 : ), [칼럼명,칼
럼명 ])
117
DataFrame 행과열 검색 2
행
열
col1
row1row2row3
col2

슬라이싱할 경우는 뒤에 행이 포함되지 않지만
내부 속성으로 접근시는 뒤에 행도 포함해서 표
시
118
row 접근시 슬라이싱 계산차이

DataFrame의 ix는 숫자로 내부의 series와 값을
갱신
119
DataFrame.ix 갱신

iat로 내부 값을 조회
121
DataFrame.iat

at로 lable로 내부 값을 조회
122
DataFrame.at

loc로 내부 값을 조회
124
DataFrame.loc

DataFrame은 단일 행을 인덱스 방식([ ])
125
DataFrame 단일 행 검색
행
열
col1
row1row2row3
col2

DataFrame은 멀티행을 슬라이싱 방식([ : ])을 사
용하지만 이름으로 검색시에는 해당 이름까지 포
함해서 처리
126
DataFrame 멀티 행 검색
행
열
col1
row1row2row3
col2

iloc로 숫자로 내부(series,값) 를 조회
127
DataFrame.iloc

128
8. Pandas series/dataframe
공통 메소드

129
데이터 head/tail 확인

Head/tail 조회 default가 5건이며, n= 숫자를 인
자로 전달해서 더 많은 건을 조회할 수 있음
131
Series head/tail조회

DataFrame은 head()메소드를 이용해서
default=5까지 검색
133
DataFrame head 검색

DataFrame은 tail()메소드를 이용해서
default=5까지 검색
134
DataFrame tail 검색

Series 생성시 NaN 값이 들어가면
isnull/notnull 메소드나 함수로 확인
137
Isnull/notnull

Series count 메소드를 이용해서 null이 아닌 갯
수를 처리
138
Series 원소의 갯수:count

Series value_counts 메소드를 사용해서 원소들
이 구성을 확인
139
Series 원소의 갯수: value_counts

key는 index이고 values는 값을 를 확인
iteritems 메소드는 index,value가 쌍으로 구성
140
Iterable 처리: iteritems

주로 series 타입이 string일 경우 series.str.문자
열메소드를 이용해서 처리하도록 구현
141
Series.str

count 메소드를 이용해서 null이 아닌 갯수를 처
리
143
count

Dataframe을 iterable 하게 처리하면 칼럼명과 칼
럼값들의 쌍(column name, Series)으로 조회
144
Iterable 처리: iteritems

Dataframe을 iterable 하게 처리하면 행명과 행값
들의 쌍(index, Series)으로 조회
145
Iterable 처리: iterrows

Dataframe을 iterable 하게 처리하면 행명과 행값
들의 쌍(index, Series)으로 조회
146
Iterable 처리: itertuples

주로 dataframe타입내의 칼럼 즉 series가 string
일 경우 series.str.문자열메소드를 이용해서 처리
하도록 구현
147
DataFrame: Series.str

148
데이터 요소 추가/갱신 메소드

1원에 대한 index 하나를 가지고 원소에 대해 조
회 및 값 변경
150
get_value/set_value

Series 들을 연결하기 위해 append 메소드를 사
용하고, index 정보가 순서적으로 붙이고 싶으면
index를 변경이 필요
151
Series들을 연결:append

다차원에 대한 index,column을 지정해서 원소에
대해 조회 및 값 변경
153
get_value/set_value

행/열기준으로 두 객체를 연결
154
Concat: 행과 열기준으로 연결 1

행/열기준으로 두 객체를 연결
155
Concat: 행과 열기준으로 연결 2

행의 값이 일치한 부분이 없을에는 empty 처리
156
DataFrame : merge 병합

subject_id에 값으로 일치하는 것만 처리
157
DataFrame : merge Inner join

열기준(subject_id)으로 모든 것을 표시
158
DataFrame : merge Outer join

타입을 변경해서 다른 series생성
161
astype : 타입 변환 후 생성

타입을 변경해서 다른 dataframe 생성
163
astype : 타입 변환 후 생성

인덱스를 지정한 대로 위치가 바뀌고 새로운
series를 생성함
166
Series sort : reindex()

index 변수에 직접 index 값을 할당해서 변경
167
Series reinex 후 index 변경

Reindex할 때 index가 추가되면 NaN 값으로 채
워지지만 ffill(앞의 값 매칭)이나 bfill(뒤의 값 매
칭)을 method에 지정하면 보간법 처리
168
Series reindex 시 값 넣기

DataFrame 내의 index를 다시 index해서 조정이
가능하며 index가 추가시 fill_value로 지정해서
값을 초기화
170
DataFrame: reindex

DataFrame 내의 원소에 대한 index/columns를
지정해서 reindexing 처리
171
DataFrame : fill_value

DataFrame 내의 원소에 대한 index를 재지정해
서 reindexing 처리시 값 처리는 method 인자에
ffill, bfill를 넣어 앞이나 뒷의 값을 기준으로 넣음
172
DataFrame :method

값을 기준으로 내부 series를 변경함
175
Series sort : sort_values()

인덱스(axis=0은 행, axis=1은 열)를 기준으로 내
부 DataFrame를 변경함
177
DataFrame sort : sort_index

값을 기준으로 내부 DataFrame를 변경함
178
DataFrame sort : sort_values()

DataFrame 내의 원소에 대한 sorting 하고
inplace로 세팅해서 내부 변경처리
179
DataFrame sort_value

Pop 메소드를 이용해서 칼럼을 꺼낸 후 삭제하기
182
칼럼 삭제: pop

Replace 메소드는 값 전체를 바꾸므로 특정부분
을 추출하여 적용할 경우에만 특정 값이 변경
183
Series 특정 원소 변경 : replace()

Insert 메소드를 이용해서 새로운 칼럼을 삽입
185
칼럼 삽입: insert

Pop 메소드를 이용해서 칼럼을 꺼낸 후 삭제하기
186
칼럼 삭제: pop

DataFrame.칼럼명 또는 [‘칼럼명’]으로 조회하면
칼럼단위로 갱신
187
DataFrame 칼럼 갱신
다른 값으로 변경 동일 값으로 변경

DataFrame[열]로 갱신시 기존에 없는 칼럼이 있
으면 칼럼 추가가 됨
188
DataFrame 갱신시 주의사항

DataFrame은 기존에 없는 column에 값을 scala
로 할당시 행에 맞춰 Broadcasting처리
189
DataFrame 칼럼 추가
행
열
col1
row1row2row3
col2

DataFrame은 기존에 없는 column에 칼럼을 할
당
190
DataFrame 칼럼 추가:칼럼복사
행
열
col1
row1row2row3
col2

DataFrame은 기존에 존재한 column에 값을 추
가할 경우 broadcasting되어 칼럼이 변경
191
DataFrame 칼럼값 변경
행
열
col1
row1row2row3
col2

칼럼별 swap 처리를 하려면 indexinf[ ]처리하기
위해 리스트에 칼럼명을 사용해서 처리
192
DataFrame 접근: swap처리

DataFrame 내의 원소를 검색한 후에 대치시킴
193
Replace : 원소 한 개 변경

DataFrame 내의 원소를 검색한 후에 대치시킴
194
Replace : 원소 여러 개 변경

Drop을 사용해서 요소를 제거함
197
Series: drop

del로 요소를 하나씩 제거함
198
Series: del

DataFrame은 기존에 존재한 column을 drop 메
소드로 삭제
200
DataFrame 칼럼 삭제 : drop

행과 열에 대한 값을 삭제 할 수 있다. 열은 axis=1
도 추가해야 함. 단, 기존 값은 변경하지 않고 새
로운 객체를 추가
201
DataFrame : drop

문자열 칼럼인 name, axis =1(칼럼 축)을 삭제
202
Name 칼럼을 drop 삭제

DataFrame은 기존에 존재한 column을 del로 삭
제
203
DataFrame 칼럼 삭제 : del
행
열
col1
row1row2row3

Series와 scalar 값과 계산시 전체를 vector 값으
로 전환해서 계산하고, vector 간 연산시는 index
가 매칭되지 않을 경우는 NaN 처리
206
Series 연산: scalar/vector

Series 인스턴스에 대한 산술연산(+,-,*,/,//,%)
207
Series : +,-,*,/,//,%

Series 인스턴스의 값들이 음수일 경우 절대값
(abs) 처리
208
Series : abs

add/radd 메소드와 sub/rsub 메소드 사용
209
Series 연산: add/sub

mul/rmul 메소드 와 mod/rmod 메소드 사용
210
Series 연산: mul/mod

div/rdiv/floordiv/rfloordiv/truediv/rtruediv/di
vide 메소드 사용
211
Series 연산: div

Series 내의 최고 발생한 것을 확인하는 메소드
212
Series : mode

평균(mean), 중앙값(median),표준편차(std), 분
산(var)에 대해 구하기
213
Series 합,평균,표준편차,분산

평균(mean), 표준편차(std), 분산(var) 등을 한번
에 구하기(describe)
214
Series 숫자 데이터 통합 조회

문자들로 값을 구성할 경우 describe는 count,
unque, 빈도에 대한 결과를 series 타입으로 반환
215
Series 문자 데이터 통합 조회

Series 인스턴스내의 동일한 숫자 원소가 몇 개인
지를 확인 (nunique)
216
Series 동일한 숫자 원소 확인

DataFrame 간의 산술연산 계산
218
산술연산자 이용

add, sub, mul 산술연산에 대한 처리
219
Dataframe : +, - , *

truediv, floordiv, mod 산술연산에 대한 처리
220
Dataframe : /,//, mod

산술연산에 대한 처리
221
Dataframe 간 우측산술연산

산술연산에 대한 처리
222
칼럼간 산술연산

칼럼에 최대 빈도 값을 출력
223
Mode 연산

DataFrame 전체에 대한 전체 통계적 정보 조회
224
describe:전체 통계정보 조회

DataFrame 특정 칼럼에 대한 통계 정보 조회
225
describe: 칼럼 통계정보 조회

describe() 에 결과를 mean()메소드로 확인
226
Describe내 값을 메소드로 확인

열에 대한 합,평균, 표준편차, 분산 처리
227
합,평균, 표준편차, 분산 : 열

행에 대한 합,평균, 표준편차, 분산 처리
228
합,평균, 표준편차, 분산 : 행

Series 인스턴스 내의 원소들에 대한 min/max 구
하거나 index 값을 구하기
231
min/max, idxmin/idxmax

Series 인스턴스 내의 원소에 대한 min/max를 찾
고 최고값이나 최저값으로 변경하는
cummin/cummax 구하기
232
Series cummin/cummax

비교나 논리 연산을 사용할 경우에도 Series 인스
턴스 전체가 처리가 되므로 이를 축소해서
boolean 처리하기 위한 메소드
233
Boolean Reductions

원소의 값이 논리식에 위한 전부 True 경우만 all()
에서 True, any() 메소드는 하나의 True만 존재해
도 True로 처리
234
any(), all() : 비교

Bool메소드는 하나의 원소의 값이 True/False 여
부 체크 및 계산된 결과가 동등한지 처리하는 메
소드
235
bool()/equals()

열에 대한 min/max 처리
237
min/max : 열

행에 대한 min/max 처리
238
min/max : 행

논리 연산에 대한 행(axis=1), 열(axis=0)에 대한
처리
239
All

행과 열의 논리 연산을 한 결과에 대해 축약형 논
리값 표시
240
any

계산된 결과가 동등한지 처리하는 메소드
241
equals()

Apply 메소드는 내부 함수를 모든 원소에 대해 계
산을 처리함
244
Dataframe 모든 원소에 적용

사용자 함수 정의 후 계산
245

칼럼정보를 받아서 sum과 count 등을 계산하는
함수 정의
246
사용자 함수 정의 확인

Platoon, Casualties 칼럼에 대한 sum,count 의
산출을 groupby 기준으로 처리
247
사용자 함수로 산출

Platoon 칼럼기준으로 Casulties 값을 가지고 합
산, 평균, 표준편차, 분산을 계산
249
Dataframe apply 적용

Platoon 칼럼기준으로 Casulties 값을 가지고 합
산, 평균, 표준편차, 분산을 계산
250
Dataframe apply 적용

문자열로 저장된 칼럼에 대해 소문자를 대문자로
전환
252
Name 칼럼에 apply 메소드 적용

문자열로 저장된 칼럼에 대해 소문자를 대문자로
전환
253
Name 칼럼에 map메소드 적용

문자열 칼럼은 변경없이 숫자타입일 경우는 100
을 곱셈함
255
모든 칼럼에 대해 함수 적용

Python+numpy pandas 3편

More Related Content

What's hot(20)

Similar to Python+numpy pandas 3편(20)

More from Yong Joon Moon(20)

Python+numpy pandas 3편