미리보기
기본 정보
안녕하세요, 데이터 분석가 강민규입니다. 데이터를 통해 문제를 해결해 나가는 과정을 좋아합니다. 데이터로부터 인사이트를 도출할 수 있도록 끊임없이 고민하고, 직관적인 분석자료를 만들기 위해 노력합니다.
기술 스택
Python, Keras, Tensorflow, scipy.stats, Rust
프로젝트
캠퍼스 EMS ESS 최적 운영 알고리즘 개발
광주과학기술원(GIST)
2024.06. ~ 2024.08.
캠퍼스의 전기 수요와 발전량을 예측한 후 에너지 저장 장치(ESS)의 충전 및 방전 시점과 양을 결정하는 문제.
태양광 발전량 및 전력 부하 예측 섹션
NA 값을 제거하기 위해 LSTM을 활용하여 값을 예측 후 대체
일몰, 일출등의 추가 데이터를 수집해 발전량 값이 낮은 시간대를 예측해 분리
시계열 데이터를 TimeSeriesKMeans로 분류 후 유사한 군집 별로 Xgboost 모델을 학습
테스트 상 초기 모델 대비 예측오차 30% 감소
ESS 스케줄링 섹션
pulp 기반의 Linear Progamming 모델을 작성
초기 LP 모델이 예측 섹션의 결과에 의존한다는 문제 발견
Robust Optimization의 재고이론 기반 불확실성 모델링 기법 적용
약 7%의 운영 비용 감소
지형적 특성을 고려한 농업용 방제 드론 동선 최적화
숭실대학교 공과대학
2024.03. ~ 2024.07.
지형적 특성이란 지표면의 고도차이를 의미하며, 고도차이를 고려해 드론이 약제를 살포할 수 있도록 경로를 최적화하는 문제.
농약 살포 지점 식별
타 플랫폼의 모델과 그레이 스케일을 활용해 픽셀을 추출
지형 모델로부터 픽셀을 (x, y, z) 좌표화
Set Covering Problem
농약이 필요한 모든 좌표를 커버할 수 있는 최적의 살포 노드 결정
Linear Programming model 작성
2분내 살포 노드의 좌표 도출
Capacity Vehicle Routing Problem
드론이 보유할 수 있는 농약 및 배터리용량이 한정되어 있는 상황에서 모든 노드를 방문하는 최적 경로 결정
거리 매트릭스를 활용해 3차원 문제를 2차원으로 바꾼 후 ortools의 local search를 활용해 경로를 도출
1분 미만의 시간내에 최적 경로를 찾았으며 기존 모델 대비 이동거리 2,273m 단축
사출성형 공정을 위한 스마트 품질관리 프로세스
숭실대학교 산업정보시스템공학과
2024.07. ~ 2024.07.
온도, 압력, 시간, 속도 등 26개의 공정 상태 값으로 구성된 26,796,510개 csv 데이터로부터 비지도 학습을 통해 상태이상을 예측해야하는 문제.
라벨링 프로세스
조사를 통해 crack, jetting, burr 등 불량과 직접적인 연관이 되는 독립변수를 추출
23개의 독립변수들을 pca를 거쳐 한개의 변수로 표현할 수 있는 선형식 도출
각 독립변수의 이동범위 관리도를 계산해 이산 데이터로 만들고 이산 데이터를 선형식에 대입해 최종 라벨 생성
기계학습 모형을 통한 불량예측
automl을 통해 2종 오류가 적은 알고리즘 4개를 선택
Grid search 통해 파라미터 튜닝
각 알고리즘 결과를 soft voting해 예측
불량으로 판별하는 로트가 74개 증가했으며 공정 불량률은 2.1%로 산업의 요구수준(2.5%)과 유사
결과적으로 모니터링이 불가능한 공정에서 데이터를 활용해 불량 로트를 예측하는 솔루션 제시