ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • pandas 데이터프레임
    프로그래밍/파이썬 2020. 8. 17. 01:31

    row(로우) = 행, columns(컬럼) = 열, df = 데이터프레임

     

    df.function(inplace = True) : 함수를 파괴적으로 바꿈 = df의 내용물이 바뀜. 반환하지 않음.

     

    pd.DataFrame(dict)

    dict = {'columnsName1'=['list1','list2'] , 'columnsName2' = [1,2] }

    dict를 데이터프레임으로 반환

     

    read_excel(path_file, sheet_name, header=None, names=None)

    엑셀 파일로 부터 데이터프레임 작성 후 반환

    <매개변수>

    파일경로

    sheet_name='sheet1' 특정 시트 지정

    header = None 혹은 int형 숫자(ex: 1) 데이터프레임의 헤더를 파일안 행안에서 지정

    names = None 혹은 ['headerName','headerName','headerName']

     

    df.append(df)

    매개변수 df를 추가하여 반환 *컬럼이름이 같으면 밑에 추가, 없을시 추가 못 함

     

    df.columns[int] 특정 컬럼이름을 숫자로 지정하여 반환

    df.index[int] 특정 인덱스이름을 숫자로 지정하여 반환

    df[string] 특정 컬럼을 df으로 반환

    df[string][int] 특정 컬럼x인덱스의 값 반환

     

    dfExcel.rename(columns={[string]:string, ... }, index={int:string, ...}, inplace=False) 인덱스나 컬럼의 이름 재정의

     

    for 루프로 특정 컬럼의 값을 하나씩 참조 가능

    for i in excel['string']:
    	print(i)

     

    dfExcel.drop(int) 지정번째 로우 전체 삭제

    dfExcel.drop(string,axis=1) 옵션 axis= 1로 'string'컬럼 지정

    columns={dfExcel.columns[int]} 로 string대신 몇번째 컬럼인지로 지정 가능

     

    예시 엑셀파일

    예시 코드

    import pandas as pd
    
    excel = pd.read_excel('excel.xlsx',header=1,names=['none','offset','name']) #파일 불러오기
                            #경로      헤더행 지정   헤더 이름 재지정
    excel=excel.drop(columns={excel.columns[0]},axis=1) # 0번째 컬럼 삭제
    excel.drop(7,inplace=True) # 8번째 행 삭제
    dfAppend = {'offset' : [1081],'name' : ['히카리']} # dict 생성
    df = pd.DataFrame(dfAppend) # 추가할 데이터 프레임 생성
    excel=excel.append(df) # df 추가
    excel.rename(columns={'offset':'오프셋', excel.columns[1]:'이름'}, inplace=True) # 컬럼 이름 재지정
    
    print(excel['오프셋'])
    for i in excel['이름']:
        print(i)

    결과

    더보기

    0    1011
    1    1021
    2    1031
    3    1041
    4    1051
    5    1061
    6    1071
    0    1081
    Name: 오프셋, dtype: int64
    타이치
    매튜
    소라
    코시로

    미미
    타케루
    히카리

     

    그 외

    df.dropna(how='any'# Nan이 존재하는 행을 삭제 후 반환

    df.astype({'columnsName':typename}) # 특정 컬럼의 데이터 형식(int, string, float 등)을 지정하여 바꾼 후 반환

    df[['columnsName1','columnsName2']] # 특정 컬럼만 남겨두고 반환

    df.to_csv(path_file, header=False, index=False) # csv파일로 출력. 확장자 text 가능. 반환값 없음?

    '프로그래밍 > 파이썬' 카테고리의 다른 글

    config파일에서 요소 불러오기  (0) 2020.08.16

    댓글

Designed by Tistory.