-
Pandas DataFrame 특정 컬럼 열_호출 추가 삭제하기▶파공's 취미 생활/▷파이썬 공부 2020. 9. 7. 18:49
안녕하세요
파이어(F.I.R.E.)를 꿈꾸는 공룡
'파공' 입니다.
오늘은 Pandas 판다스 DataFrame 데이터프레임의 특정 컬럼(열)을 호출, 추가, 삭제 하는 법에 대해서 말씀드리겠습니다!
1. 샘플 데이터 프레임 생성하기
우선 Pandas 라이브러리를 import 하고 샘플로 사용할 데이터프레임을 생성합니다.
(데이터프레임 생성하는 법은 아래 링크를 참고해주세요!)
"Pandas DataFrame 생성 만들기 (+ Numpy 행렬 이용하는법)"
<코드>
import pandas as pd
df_1 = pd.DataFrame( {'c1' : ['a', 'b', 'c'], 'c2' : [1, 2, 3], 'c3' : [4, 5, 6]}, index=['A', 'B', 'C'] )
df_1<실행 화면>
2. 특정 컬럼 (열) 호출하기
2-1. 하나의 특정 컬럼(열)만 호출------------
<코드>
df_1[ 'c1' ]
<실행 화면>
2-2. 여러개의 특정 컬럼(열) 호출------------
<코드>
df_1[ ['c1', 'c3'] ]
<실행 화면>
위 처럼 여러개의 컬럼을 호출하게 되면, 결과를 또다른 데이터프레임 형식으로 불러오게 됩니다.
<참고>슬라이싱으로 호출하게 되면 행 기준으로 호출하게 됩니다.------------
<코드>
df_1[0:2]
<실행 화면>
슬라이싱을 0:2로 했기 때문에 첫번째, 두번째 행을 호출하게 됩니다.
3. 컬럼(열) 추가하기
저희가 샘플로 사용하고 있는 데이터프레임 df_1을 다시 한 번 보고 가겠습니다.
3-1. 가장 마지막에 컬럼(열) 추가하기_기본------------
<코드>
df_1['c4'] = [7,8,9]
df_1<실행 화면>
새로운 컬럼(열을) 추가 하실때는 새로운 컬럼 명과 함께 데이터들을 써주시면 됩니다.
위에서는 기존에 없던 'c4'라는 컬럼이 새로 추가 되었음을 알 수 있습니다.
새로운 컬럼이 추가 될 때는 가장 마지막에 추가 되는것이 기본입니다.
아래와 같이, 기존 데이터프레임의 데이터들을 가지고 연산하면서 새로운 컬럼을 추가할 수도 있습니다.
<코드>
df_1['c5'] = df_1['c2'] + df_1['c3']
df_1<실행 화면>
위를 보시면 컬럼 'c2'와 'c3'의 데이터들을 + 연산하여 'c5' 컬럼이 생성 되었음을 확인 할 수 있습니다.
3-2. 중간에 새로운 컬럼(열) 추가하기------------
<코드>
df_1.insert( 2, 'wow', [10, 11, 12])
df_1
<실행 화면>
위처럼 중간에 새로운 컬럼(열)을 추가하고 싶으실 때는 insert를 사용해주시면 됩니다.
위그림을 보시면 3번째 컬럼 자리에 새로운 컬럼이 추가 되었고,
컬럼명은 'wow' , 데이터는 10, 11, 12가 들어갔음을 확인 하실 수 있으실 겁니다.
4. 특정 컬럼 삭제하기
<코드>
df_1.drop( 'wow', axis=1)
<실행 화면>
위 데이터프레임에서 'wow' 컬럼이 삭제 되었음을 확인할 수 있습니다.
하지만 이때 .drop의 경우 원본 데이터를 바꾸지는 않는다는 점을 주의하셔야 합니다.
위 그림을 보시면, df_1.drop으로 'wow' 컬럼을 삭제 했지만, df_1을 다시 호출 하면'wow' 컬럼이 살아 있습니다.
즉, 원본 데이터 df_1 은 수정되지 않습니다.
이때, df_1 원본 데이터를 수정하고 싶으시다면, 아래와 같이 "inplace = True" 라는 문구를 넣어 주셔야 합니다.
이러면 원본 데이터인 df_1을 호출 했을 때, 'wow' 컬럼이 삭제 되었음을 확인할 수 있습니다.
오늘도 글 읽어 주셔서 감사합니다!
Look Rich or Be Rich
현명한 선택을 응원합니다.
-파공-
'▶파공's 취미 생활 > ▷파이썬 공부' 카테고리의 다른 글
Pandas DataFrame Index 판다스 데이터프레임 인덱스 수정 (0) 2021.07.13 파이썬 포맷팅 Format (feat. %, {}, f-string) 알아보기 (0) 2021.03.09 Pandas DataFrame 특정 로우(행) 호출, 수정, 추가, 삭제 하는 법 (4) 2021.01.20 Pandas DataFrame 생성 만들기 (+ Numpy 행렬 이용하는법) (2) 2020.09.04 주피터 노트북 시작 폴더 위치 변경_Jupyter Notebook (2) 2020.08.25