인재 DB 등록 시 유의사항

CLOSE

채용공고 지원 시 유의사항

CLOSE
로그인 선택

SKT 그랜드뷰 서비스 개발 - 설비(기기)의 RUL 예측 - 연구계획(1)

aassdd38 22.06.23
177 5 0

1.연구 과제 소개

1-1. 연구 배경 및 목적

기기의 유지보수와 관련된 예측모델은 제조업의 경우 주요 핵심자산이 설비와 관련해서 비용/매출과 직결되므로 매우 중요한 영역입니다.

RUL 예측은 장애에 대한 조기 경보 및 장애발생 시점 예측 정보를 제공하며 시스템 건전성 예측 관리에 있어서 중요한 구성요소가 될 수 있습니다. 이를 통해 엔지니어는 유지보수 일정을 설정하고 운영 효율성을 최적화하며 계획되지 않은 다운타임을 방지할 수 있습니다.

특히, 제조환경에서는 장애이력 데이터가 제대로 수집/관리되지 않고 있기 때문에 단순한 이상감지가 아니라 정확한 장애시점을 예측하는 것이 어려운 과제입니다.


1-2. 연구 내용 및 목표

RUL이란 Remaining Useful Life의 약자입니다. 저희의 프로젝트는 사전에 RUL을 예측하여 Threshold 이하로 RUL이 떨어지면 장비가 고장나기 전에 사전에 알람을 발생시키는 것을 목표로 하고 있습니다.

  • Threshold 값은 임의로 정할 수 있으며 (Threshold 값 자체의 예측/탐색도 주요한 주제입니다)

  • 모델은 SOTA를 활용한 여러개의 모델로 성능을 비교하여 가장 성과가 좋은 모델로 채택합니다.

  • 성과는 RMSE, MAE, MSE 등으로 측정합니다.


1-3. 활용 계획

SKT의 설비 예지정비 솔루션인 “그랜드뷰”에 해당 기능을 탑재/적용

RUL을 예측하게 된다면 정비/수리/교체 등의 계획을 사전에 수립하고 대응할 수 있습니다. (예를 들어, 바로 정비를 하는 것이 아니라 유지보수 계획에 맞추어서 장비의 가동시간을 더 늘리는 매출 증대 측면에서 모델을 활용할 수 있습니다.) 사전에 정비를 통한 품질을 높일 수 있습니다. 예기치 못한 상황에 대비를 함으로써 유지보수에 대한 비용을 절감하고 효율화 할 수 있습니다.

해당 모델을 SKT의 예지정비 솔루션(그랜드뷰)에 탑재하여, 제조기업의 설비 관리에 도움을 주고자 합니다.


2. 연구 계획(연구 방향성, 계획)

2-1. 추진 계획

image.png

저희 팀의 전체적인 달별 계획은 위와 같이 계획하였고, 전체 추진 계획 플로우는 크게 다음과 같습니다.

  • 문제 정의 → 데이터셋 탐색 및 EDA → 모델 정의 → 성능 개선

이에 따른 진행 상황은 현재 다음과 같습니다.

문제 정의

  • RUL이 무엇인가(완료)

  • RUL 예측의 기대효과는 무엇인가(완료)

  • RUL 예측에서 SOTA 인 모델은 무엇이 있는가(완료)

데이터셋 탐색 및 EDA

  • CMAPSS 파악 및 EDA 진행(완료)

  • NCMAPSS 파악 및 EDA 진행(일부 진행)

  • 추가 데이터셋 파악(예정)

모델 정의

  • RVE 구조 파악 및 성능 테스트(일부 진행)

  • Stacked DCNN 구조 파악 및 성능 테스트(일부 진행)

  • Semi-Supervised Deep Architecture 구조 파악 및 성능 테스트(예정)

  • Custom 모델 구현(예정)

성능 개선

  • RUL Threshold 값 설정(일부 진행)

  • RMSE, MSE, MAE 측정(예정)

  • 하이퍼파라미터 설정 및 Overfitting 여부 파악 등 추가 모델 튜닝(예정)

앞으로 남은 계획들을 성공적으로 수행하기 위해 저희 다쿠야키 팀은 열정을 다하겠습니다.


2-2. 데이터 소개 및 전처리(EDA)

CMAPSS 역학모델

CMAPSS란 Commercial Modular Aero-Propulsion System의 약자로 W, Xs, Xv, Theta 네 분야의 변수로 이루어진 방정식을 사용해 터보 엔진의 열화에 따라 여러 측정값들과 센서값들을 관측한, RUL 예측 임무에 자주 사용되는 역학 모델입니다.image.png


W는 Scenario descriptor, Xs 는 Measurements, Xv는 Virtual Sensor, Theta는 Model Health Parameter를 말합니다.

image.png


CMAPSS 데이터셋

앞서 설명드린 CMAPSS 역학모델을 사용한 CMAPSS 데이터셋은 NASA에서 제공한 터보펜 엔진 성능 저하 시뮬레이션 데이터셋입니다. 이 데이터셋은 작동조건과 고장조건에 따라 FD1,FD2,FD3,FD4의 4개의 서로 다른 세트가 존재합니다. 작동조건과 고장조건이 많을수록 더 RUL 예측이 어려울 것으로 보입니다.

  • FD001: 작동 조건 1개, 고장 조건 1개(HPC)

  • FD002: 작동 조건 6개, 고장 조건 1개(HPC)

  • FD003: 작동 조건 1개, 고장 조건 2개(HPC, Fan)

  • FD004: 작동 조건 6개, 고장 조건 2개(HPC, Fan)

image.png난이도: FD001 < FD003 < FD002 < FD004


CMAPSS EDA

EDA란 Exploratory Data Analysis의 약자로, 수집한 데이터가 들어왔을 때, 이를 다양한 각도에서 관찰하고 이해하는 과정입니다. 한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다.

FD001, FD002, FD003, FD004로 이뤄진 CMAPSS 데이터셋에 대해 먼저 EDA를 진행해보았습니다.

먼저 FD001,FD002,FD003,FD004의 데이터들은 다음과 같은 column들과 값들을 가지고 있습니다.

image.png

image.png

FD001 데이터의 기초 통계량 분석 - 총 20631개의 row가 존재.

image.png

image.png

FD002 데이터의 기초 통계량 분석 - 총 53759개의 row가 존재.