Skip to content

2023-2-SDA-team/final_team_project

Repository files navigation

final_team_project

팀원: 오명빈, 최준호, 유홍녕

문제 정의

  1. 문제인식

현재의 건강 관리 환경에서 국민건강검진 데이터는 중요한 정보를 담고 있습니다. 현재 건강 관리 분야에서 중요한 주제 중 하나는 흡연이 건강에 미치는 영향입니다. 국민건강검진 데이터를 통해 흡연 여부와 다양한 건강 지표 간의 관계를 파악하는 것은 향후 효과적인 건강 정책 및 예방 전략을 개발하는 데 기여하고 있습니다. 위 자료를 토대로 국민의 건강 상태를 종합적으로 파악할 수 있습니다. 특히, 이 데이터를 활용하여 흡연 여부와 건강 지표 간의 연관성을 조사함으로써 흡연이 건강에 미치는 영향을 파악할 수 있다고 생각합니다.

  1. 분석 목표

국민건강검진 데이터를 활용하여 다양한 건강 지표와 흡연 여부 간의 상관 관계를 탐구하는 것입니다. 특히, 혈압, 혈당 등과 같은 건강 지표가 흡연여부와의 연관성이 있는 지 확인해보려 합니다.

실행 계획

  1. 데이터수집 방법

[1] 공공데이터 포털 - <국민건강보험공단_건강검진정보>

건강검진정보란 국민건강보험의 직장가입자와 40세 이상의 피부양자, 세대주인 지역가입자와 40세 이상의 지역가입자의 일반건강검진 결과와 이들 일반건강검진 대상자 중에 생애전환기건강진단 수검이력이 있는 각 연도별 수진자 100만 명에 대한 기본정보와 검진내역으로 구성된 개방데이터

[2] Domain Research

흡연으로 인한 건강피해 요소 및 흡연 시 높게 나오는 건강수치 등을 조사

  1. 데이터 분석 방법

[1] Data Distribution checking

  • 데이터의 분포 및 Statistic을 확인해보고 plot으로 시각화
  • Measures of Central Tendency

[2] Data Preprocessing

  • Raw data이기 때문에 필요없는 feature와 Missing value 및 outliar확인

[3] statistical analysis

  • 각각의 피쳐와 흡연여부를 통계학적 기법을 적용해 상관성을 분석

About

흡연 상태와 연관있는 column 알아보기

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published