Python

Pandas 데이터 정렬하기, 날짜형 변환(to_datetime), pandasql, csv파일 불러오기/저장하기

춘식이2 2022. 8. 15. 21:22

Jupyter Notebook 시작하기

#명령프롬프트 들어가기 (win- cmd , mac - terminal)
python -m notebook

 

import pandas as pd

# csv파일 불러오기
data = pd.read_csv('C:\jupyter\data.csv', encoding= 'unicode_escape')

#데이터 정렬하기
data = data.sort_values(['CustomerID', 'InvoiceNo'], ascending = True)
data

# Dataframe의 형을 datatime으로 바꿔주기
data['InvoiceDate'] = pd.to_datetime(data['InvoiceDate'])
data

 

Dataframe을 sql로 다루기

# Package를 설치합니다.
!pip install -U pandasql

# pandas sql 패키지 설치하기
from pandasql import sqldf
import pandas as pd

sql쿼리 작성하기

q = """
sql 쿼리 넣기
"""
re_df = sqldf(q, globals())

jupyter에서 CSV파일로 저장하기

#csv 파일로 저장하기
re_df.to_csv('sample.csv')