KSIC (Korea Standard Industry Code) dataset and using in Python.
KSIC (Korea Standard Industry Code), 한국표준산업분류
생산단위(사업체단위, 기업체단위 등)가 주로 수행하는 산업 활동을 그 유사성에 따라 체계적으로 유형화한 표준 코드이다. 코드는 대분류(알파벳 1자리), 중분류(2자리), 소분류(3자리), 세분류(4자리), 세세분류(5자리) 종류가 있다. 금융감독원 전자공시(DART)에서 회사(종목)의 산업분류에 소분류(3자리)를 사용하고 있다.
통계청 한국표준산업분류코드(KSIC)
코드의 내용과 항목을 상세하게 보려면,
(2018년 9월 현재) 9차 개정안이 주로 사용되고 있다(전자공시 등)
- KSIC 9차 개정(2008년) - 항목수 1,931개
- KSIC 10차 개정(2017년) - 항목수 2,000개
KSIC 9차 https://github.com/FinanceData/KSIC/raw/master/KSIC_09.csv.gz
- 1,931 rows
- 2 columns
KSIC 10차 https://github.com/FinanceData/KSIC/raw/master/KSIC_10.csv.gz
- 2,000 rows
- 2 columns
import pandas as pd
url = 'https://github.com/FinanceData/KSIC/raw/master/KSIC_09.csv.gz'
df_ksic = pd.read_csv(url, dtype='str')
df_ksic.head(10)
Industy_code | Industy_name | |
---|---|---|
0 | 01 | 농업 |
1 | 011 | 작물 재배업 |
2 | 0111 | 곡물 및 기타 식량작물 재배업 |
3 | 01110 | 곡물 및 기타 식량작물 재배업 |
4 | 0112 | 채소, 화훼작물 및 종묘 재배업 |
5 | 01121 | 채소작물 재배업 |
6 | 01122 | 화훼작물 재배업 |
7 | 01123 | 종자 및 묘목 생산업 |
8 | 0113 | 과실, 음료용 및 향신용 작물 재배업 |
9 | 01131 | 과실작물 재배업 |
10 | 01132 | 음료용 및 향신용 작물 재배업 |
11 | 0114 | 기타 작물 재배업 |
12 | 01140 | 기타 작물 재배업 |
13 | 0115 | 시설작물 재배업 |
14 | 01151 | 콩나물 재배업 |
15 | 01152 | 채소, 화훼 및 과실작물 시설 재배업 |
16 | 01159 | 기타 시설작물 재배업 |
17 | 012 | 축산업 |
18 | 0121 | 소 사육업 |
19 | 01211 | 젖소 사육업 |
중분류(2자리)~세세분류까지(5자리) 코드인데 뒤쪽에 0으로 채워서 사용하는 경우가 더 편리한 경우가 있다. 다음과 같이 pad 하여 사용할 수 있다.
df_ksic['Industy_code'] = df_ksic['Industy_code'].str.pad(width=5, side='right', fillchar='0')
df_ksic.head(10)
Industy_code | Industy_name | |
---|---|---|
0 | 01000 | 농업 |
1 | 01100 | 작물 재배업 |
2 | 01110 | 곡물 및 기타 식량작물 재배업 |
3 | 01110 | 곡물 및 기타 식량작물 재배업 |
4 | 01120 | 채소, 화훼작물 및 종묘 재배업 |
5 | 01121 | 채소작물 재배업 |
6 | 01122 | 화훼작물 재배업 |
7 | 01123 | 종자 및 묘목 생산업 |
8 | 01130 | 과실, 음료용 및 향신용 작물 재배업 |
9 | 01131 | 과실작물 재배업 |