-
pandas 데이터프레임프로그래밍/파이썬 2020. 8. 17. 01:31
row(로우) = 행, columns(컬럼) = 열, df = 데이터프레임
df.function(inplace = True) : 함수를 파괴적으로 바꿈 = df의 내용물이 바뀜. 반환하지 않음.
pd.DataFrame(dict)
dict = {'columnsName1'=['list1','list2'] , 'columnsName2' = [1,2] }
dict를 데이터프레임으로 반환
read_excel(path_file, sheet_name, header=None, names=None)
엑셀 파일로 부터 데이터프레임 작성 후 반환
<매개변수>
파일경로
sheet_name='sheet1' 특정 시트 지정
header = None 혹은 int형 숫자(ex: 1) 데이터프레임의 헤더를 파일안 행안에서 지정
names = None 혹은 ['headerName','headerName','headerName']
df.append(df)
매개변수 df를 추가하여 반환 *컬럼이름이 같으면 밑에 추가, 없을시 추가 못 함
df.columns[int] 특정 컬럼이름을 숫자로 지정하여 반환
df.index[int] 특정 인덱스이름을 숫자로 지정하여 반환
df[string] 특정 컬럼을 df으로 반환
df[string][int] 특정 컬럼x인덱스의 값 반환
dfExcel.rename(columns={[string]:string, ... }, index={int:string, ...}, inplace=False) 인덱스나 컬럼의 이름 재정의
for 루프로 특정 컬럼의 값을 하나씩 참조 가능
for i in excel['string']: print(i)
dfExcel.drop(int) 지정번째 로우 전체 삭제
dfExcel.drop(string,axis=1) 옵션 axis= 1로 'string'컬럼 지정
columns={dfExcel.columns[int]} 로 string대신 몇번째 컬럼인지로 지정 가능
예시 엑셀파일
예시 코드
import pandas as pd excel = pd.read_excel('excel.xlsx',header=1,names=['none','offset','name']) #파일 불러오기 #경로 헤더행 지정 헤더 이름 재지정 excel=excel.drop(columns={excel.columns[0]},axis=1) # 0번째 컬럼 삭제 excel.drop(7,inplace=True) # 8번째 행 삭제 dfAppend = {'offset' : [1081],'name' : ['히카리']} # dict 생성 df = pd.DataFrame(dfAppend) # 추가할 데이터 프레임 생성 excel=excel.append(df) # df 추가 excel.rename(columns={'offset':'오프셋', excel.columns[1]:'이름'}, inplace=True) # 컬럼 이름 재지정 print(excel['오프셋']) for i in excel['이름']: print(i)
결과
더보기0 1011
1 1021
2 1031
3 1041
4 1051
5 1061
6 1071
0 1081
Name: 오프셋, dtype: int64
타이치
매튜
소라
코시로
죠
미미
타케루
히카리그 외
df.dropna(how='any') # Nan이 존재하는 행을 삭제 후 반환
df.astype({'columnsName':typename}) # 특정 컬럼의 데이터 형식(int, string, float 등)을 지정하여 바꾼 후 반환
df[['columnsName1','columnsName2']] # 특정 컬럼만 남겨두고 반환
df.to_csv(path_file, header=False, index=False) # csv파일로 출력. 확장자 text 가능. 반환값 없음?
'프로그래밍 > 파이썬' 카테고리의 다른 글
config파일에서 요소 불러오기 (0) 2020.08.16 댓글