본문 바로가기

전체 글

(102)
07_01_56. dropna 함수 (결측치 제거) 데이터에 NaN 값이 존재하는 경우 결측치 제거하는 방법을 살펴보고자 한다. import pandas as pd df = pd.read_excel('tmp.xlsx') df 1. 결측치가 존재하는 행 제거하기 # Listwise 방식으로 제거 # 행 기준으로 삭제 : 결측치가 존재하는 행이 삭제됨 df.dropna(axis=0) # df.dropna() # df.dropna(axis=0, how='any') # 결측이 있는 행 전부 2. 결측치가 존재하는 열 제거하기 # 열 기준으로 삭제 : 결측치가 존재하는 컬럼이 삭제됨 df.dropna(axis=1) 3. 특정 컬럼에 존재하는 na에 대해서만 고려 할 때, subset 이용 # 특정 컬럼에 존재하는 na에 대해서만 고려 할 때, subset 이용 d..
07_01_55. 날짜, 시간 함수 strptime , strftime 날짜, 시간 값을 문자열로 출력 strftime 함수 이용 import pandas as pd import datetime ## 날짜, 시간을 문자열로 출력 => strftime now = datetime.datetime.now() print(now) nowdate = now.strftime('%Y-%m-%d') print(nowdate) nowtime = now.strftime('%H:%M:%S') print(nowtime) print(type(nowdate)) 문자열로부터 날짜와 시간 정보를 읽어서 datetime.datetime 객체 생성 strptime 함수 이용 date = datetime.datetime.strptime('2020-06-21 12:25:39', '%Y-%m-%d %H:%M:%S..
07_01_54. 'UTM-K' to 'WGS84' 변환 import pandas as pd import geopandas as gpd import pyproj from fiona.crs import from_epsg import os # dw 연결 import ibm_db_dbi # Setting conn = ibm_db_dbi.connect("DRIVER={IBM DB2 ODBC DRIVER}; Database='db이름'; Hostname=hostip입력; Port=portnumber입력; PROTOCOL=TCPIP; UID=userid입력; PWD=비밀번호입력", "", "") query_biz = ''' 쿼리 ; ''' # Sql df_dw = pd.read_sql( query_biz, conn) # 컬럼명 소문자 변환 df_dw.columns = d..