전체 글 (102) 썸네일형 리스트형 10_01. PERCENT_RANK() 와 CUME_DIST() 함수 각 파티션별 행의 순서별 백분율과 현재 행보다 작거나 같은 건수에 대한 누적백분율을 구해보고자 한다! 1. PERCENT_RANK 함수 - 상대적 밴분위수를 RETURN 함 - 0~1 의 범위로 결과값이 나옴 (SQL Server 는 지원하지 x) SELECT DEPT, NAME, SAL ,PERCENT_RANK()OVER(PARTITION BY DEPT ORDER BY SAL) AS PERCENT_RANK FROM TABLE; 2. CUME_DIST 함수 - 현재 행보다 작거나 같은 건수에 대한 누적 백분율 나타냄 - 0~1 의 범위로 결과값이 나옴 (SQL Server 는 지원하지 x) SELECT DEPT, NAME, SAL ,CUME_DIST()OVER(PARTITION BY DEPT ORDER .. 07_01_53. enumerate 함수 이용한 for 문 리스트가 있는 경우 순서와 리스트의 값을 전달하는 기능을 순서가 있는 자료형(list, set, tuple, dictionary, string)을 입력으로 받아 인덱스 값을 포함하는 enumerate 객체를 리턴 보통 enumerate 함수는 for문과 함께 자주 사용 l_range = list(range(0,10)) for i, value in enumerate(l_range): print( i," : ",value) [결과] https://wikidocs.net/20792 07_01_50. DataFrame의 문자열 칼럼을 분할하여 일부분으로 새로운 칼럼 만들기 df 라는 데이터프레임의 variable 값 형태가 'A_01' 형태로 되어 있음 1. split을 이용하여 '_' 를 구분자로 지정한 후, A와 01을 분리 2. 분리하면 [A, 01] 형태의 튜플로 데이터가 저장됨 3. 첫번째 A 값을 div 라는 컬럼의 값으로 생성 4. 두번째 01 값을 line이라는 컬럼의 값으로 생성하여 두 컬럼 생성하기 df['div'] = df['variable'].str.split('_').str[0] df['line'] = df['variable'].str.split('_').str[1] 이전 1 ··· 8 9 10 11 12 13 14 ··· 34 다음