1차원의 데이터를 관리하는컨테이너이면 dict 타
입처럼 index와 value가 항상 연계되어 처리
6
Series 구조 : 1차원
index
0
1
2
data: 실제 데이터 값
index : 데이터를 접근할 정보
index.name으로 index도
name을 지정할 수 있음
dtypes : 데이터들의 타입
name : Series 인스턴스의 이름
values
dtypes
7.
1차원의 데이터를 관리하는컨터이너이며 index
등을 별도로 정의할 수 있음
7
Series 구조 생성
8.
Series 인스턴스들이 DataFrame의칼럼으로 들
어가는 구조 columns는 series 명이 되어야 하고
index는 series의 index로 처리
8
DataFrame 구조: 2차원
Index(행)
Column(열)
col1 col2 col3
row1row2row3
index
0
1
2
values
dtype
name
index
0
1
2
values
dtype
name
index
0
1
2
values
dtype
name
Series에서
DataFrame
전환
9.
n*m 행렬구조를 가지는데이터 구조이고 index
와 column이 별도의 명을 가지고, column별로
다른 데이터 타입을 가질 수 있음
9
DataFrame 생성
Index(행)
Column(열)
col1 col2 col3
row1row2row3
10.
3차원의 데이터를 관리하는컨테이너
10
Panel 구조 : 3차원
index
item0
item1
data
Index(행)
Column(열)
col1 col2 col3
row1row2row3
DataFrame
Index(행)
Column(열)
col1 col2 col3
row1row2row3
data = {'Item1' : pd.DataFrame(np.random.randn(3, 3)),
'Item2' : pd.DataFrame(np.random.randn(3, 3))}
pd.Panel(data)
[ ] 연사자내의 숫자는 마지막을 포함하지 않지
만 문자일 경우 마지막 값도 처리
12
슬라이싱 처리시 숫자와 문자
[0,0] [0,1] [0,2]
Row : 행
Column: 열
0
0 1 2
[0,0] [0,1] [0,2]
Column: 열
0
a b c
숫자로 조회 문자로 조회
13.
[ ] 연산자로원소값(scalar) 및 일차원(Series) 조
회
13
원소값, 일차원
[0,0]
Row : 행
Column: 열
[0,0] [0,1] [0,2]
Row : 행
Column: 열
0
0 1 2
labels, names으로 분리해서접근할 수 있는 정보
를 관리
16
Index에 대한 객체화
Index(행)
Column(열)
col1 col2 col3
row1row2row3
labels
names
Index에 대한 위치관리
Levels에 대한 명
labels
names
Column 에 대한 위치관리
Levels에 대한 명
Index(행) Column(열)
17.
Levels, labels, names으로분리해서 접근할 수 있
는 정보를 관리
17
multiIndex에 대한 객체화
Index(행)
Column(열)
col1 col2 col3
row1row2row3
levels
labels
names
Index에 대한 이름관리
Index에 대한 위치관리
Levels에 대한 명
levels
labels
names
Column 에 대한 이름관리
Column 에 대한 위치관리
Levels에 대한 명
Index(행) Column(열)
row1row2row3
col1 col2 col3
n*m 행렬구조를 가지는데이터 구조 생성
35
DataFrame 생성
class DataFrame(pandas.core.generic.NDFrame)
| 2차원 행렬
| Parameters
| ----------
| data : numpy.ndarray ,dict, or DataFrame
| dict can contain Series, arrays, constants, or list-like objects
| index : Index or array-like
| 행에 대한 정보 기본은 np.arange(n), 명칭도 부여 가능
| columns : Index or array-like
행에 대한 정보 기본은 np.arange(n), 명칭도 부여 가능
| dtype : dtype, default None
| Data type to force, otherwise infer
| copy : boolean, default False
| Copy data from inputs. Only affects DataFrame / 2d ndarray input
36.
Series로 DataFrame를 생성하고하나의 칼럼을 조회
해 보면 Series 타입으로 조회 되고 DataFrame의
values는 ndarray으로 2차원으로 관리
36
DataFrame 내부 data type
37.
DataFrame 는 value값을 ndarray와 index를
Index 타입으로 구성
37
DataFrame 내부 data type
하나의 칼럼을 기준으로group화해서 칼럼들에
대한 연산 처리
76
Groupby
letter one two
0 a 1 2
1 a 1 2
2 b 1 2
3 b 1 2
4 c 1 2
one two
letter
a 2 4
b 2 4
c 1 2
letter one two
0 a 1 2
1 a 1 2
2 b 1 2
3 b 1 2
4 c 1 2
two
letter one
a 1 4
b 1 4
c 1 2
Apply 메소드는 내부함수를 모든 원소에 대해 계
산을 처리함
78
Dataframe 모든 원소에 적용
Index(행)
Column(열)
col1 col2 col3
row1row2row3
df.apply(func)
Apply 메소드
func(df 원소값)을 넣어 전체 값
을 전환
Index(행)
Column(열)
col1 col2 col3
row1row2row3
Index는 index, 원소는values에 보관됨
85
Series 구조 속성 1
변수 설명
name Series 인스턴스에 대한 이름
shape DataFrame의 행렬 형태를 표시
dtypes 행과 열에 대한 데이터 타입을 표시
ndim 차원에 대한 정보 표시
strides 데이터를 구성하는 총 갯수
index 생성된 행에 대한 index 표시
values 실제 data를 Numpy 로 변환
86.
원소의 개수는 타입등 추가 정보를 보관
86
Series 구조 속성 2
변수 설명
size 원소들의 갯수
ftypes
Return the ftypes (indication of sparse/dense and
dtype) in this object.
axes 행과 열에 대한 축을 접근 표시
empty 내부가 없으면 True 원소가 있으면 False
base
기본 데이터의 메모리를 공유하는 경우에는 기본
객체를 반환
87.
Axes(축)은 Index클래스에 대한정보를 가지고
있고, index(0)에 대한 labels구성에 대한 축을 관
리
87
attribute : axes
empty, ftypes에 대한속성 값들을 확인
106
attribute : empty, ftypes
변수 설명
ftypes
Return the ftypes (indication of sparse/d
ense and dtype) in this object.
empty
DataFrame 내부가 없으면 True 원소가
있으면 False
107.
size, values, T에대한 속성 값들을 확인
107
attribute : size, values, T
변수 설명
size 원소들의 갯수
values Numpy 로 변환
T 행과 열을 변환
108.
Axes(축)은 Index클래스에 대한정보를 가지고
있고, index(0)/ columns(1)에 대한 labels구성에
대한 축을 관리
108
attribute : axes