미리보기
기본 정보
고객 맞춤형 데이터 분석가 & 프로젝트 매니저 신입 최수민입니다. 고객사의 니즈를 발 빠르게 맞춰 인공지능 학습용 데이터 30만 장 추가 계약까지 이끈 경험이 있습니다. GA4는 구글 머천다이즈로 실습해본 경험이 있습니다
기술 스택
Python, SQL, Google Sheets, Slack, Google Analytics
경력
주식회사알체라(AlcheraInc.)
Superviser | Data Sience
2024.04. ~ 2024.08. (5개월)
≪≪프로젝트: H사 자율주행 인공지능 학습용 데이터 구축 (24.05 - 24.07, 약 3개월)≫≫
성과
- 자율주행 인공지능 학습용 데이터셋의 데이터 정확도 평균 98% 이상으로 총 5회 납품 이후 고객사의 추가 계약(30만 장)을 성사.
역할 및 책임
- 데이터 품질 관리 및 최종 납품 책임자로서, 라벨링 팀을 이끌고 데이터 품질 검사와 납품 과정 총괄.
- 데이터 전처리 팀원 교육, 라벨링 가이드 제작, 작업 품질 검수를 주도하여 팀의 작업 일관성을 유지.
- 고객사와의 소통을 통한 데이터 전처리 기준 확립.
주요 성과와 기여도
- 데이터 15만 장 세그멘테이션 라벨링 작업 (20%)
- 결과물 재검수 및 품질 관리 (20%)
- Q&A 가이드 제작과 인력 교육 (50%)
- 데이터 품질 관리 및 최종 납품(15만 장) (50%)
사용 기술 및 툴
- Python(데이터 시각화, 업무 자동화, 파일 변환)
- Google Spread Sheet(프로젝트 관리, 인력 관리)
≪≪프로젝트: S사 필기체 인식 인공지능 학습용 데이터 구축 (24.04 - 24.06, 약 2개월)≫≫
성과
- 한, 중, 일 필기체 30만 자 데이터셋을 단기간(2개월)에 구축 및 납품, 고객사의 요구사항을 충족하여 최종 결과물 납품.
역할 및 책임
- 데이터 품질 관리와 납품을 총괄하고 라벨링 팀 교육 및 작업 일관성 유지 책임을 수행.
주요 성과와 기여도
- 필기체 데이터 라벨링 작업 (20%)
- 결과물 재검수 및 품질 관리 (20%)
- 라벨링 교육 및 데이터 품질 관리 (50%)
사용 기술 및 툴
- Python(업무 자동화, 파일 변환, 데이터 전처리)
- Google Spread Sheet(인력 및 진행 상황 관리)
주식회사알체라(AlcheraInc.)
Operator | Data Sience
2023.01. ~ 2023.04. (4개월)
≪≪프로젝트: H사 자율주행 인공지능 학습용 데이터 구축 (23.01 - 23.04, 약 4개월)≫≫
성과
- 자율주행 AI 학습용 데이터 구축을 위해 도로 환경 큐레이션과 세그멘테이션 작업 (10만 장)
역할 및 책임
- 데이터 라벨링을 담당하며, 도로 환경 큐레이션과 시나리오 기반 세그멘테이션 작업을 통해 데이터의 정확도와 일관성 유지.
- 팀원 작업 재검수 및 라벨링 가이드 제작.
주요 성과와 기여도
- 도로 환경 세그멘테이션 라벨링 (10%)
- 결과물 재검수 및 가이드 제작 (50%)
사용 기술 및 툴
- Google Spread Sheet(진행 상황 기록)
- 알체라 자체 데이터 라벨링 툴(큐레이션 및 비박스)
알체라
Operator | Data Sience
2022.06. ~ 2022.08. (3개월)
≪≪프로젝트: D사 건물 외벽 균열탐지 프로젝트 (22.06 - 22.08, 약 3개월)≫≫
성과
- 건물 외벽 균열 탐지용 이미지 데이터(8,000장)를 세그멘테이션 라벨링하여 품질 기준을 만족하며 최종 납품.
역할 및 책임
- 데이터 라벨링과 검수 작업 담당으로, 팀원들과 협력하여 이미지 데이터 품질을 일관성 있게 관리.
주요 성과와 기여도
- 세그멘테이션 라벨링 직접 참여 (20%)
- 품질 검토 및 최종 검수 (50%)
사용 기술 및 툴
- CVAT(세그멘테이션 라벨링)
- Google Spread Sheet(프로젝트 상황 기록)
프로젝트
한국과 서양권의 비만 예측 분석 프로젝트
멀티 캠퍼스 데이터 분석 및 엔지니어링 취업 캠프
2024.02. ~ 2024.03.
◼ 세미 프로젝트 (한국과 서양권의 비만 예측 분석)
⚫ 프로젝트 주제 및 개요
비만도 예측 모델링을 통한 한국과 서양권 국가들 간에 비만도에 영향을 주는 요인 분석
⚫ 역할분담
공통: 데이터 전처리, 시각화 및 EDA
개별: 모델링(1차, 2차, 3차), 포트폴리오 제작 및 발표 준비
1차 : 캐글 데이터 1차 분석
최수민(Decision Tree, RandomForest) 외 3인 {XGBoost, (GBM & LGBM), Logistic Regression}
2차 :한국 데이터 분석 최수민(XGBoost) 외 3인 {(Decision Tree & RandomForest),(GBM & LGBM), Logistic Regression}
3차 : 캐글 데이터 2차 분석 최수민(XGBoost) 외 3인{(Decision Tree & RandomForest),(GBM & LGBM), Logistic Regression}
발표 : 초안 작성-최수민 외 3인 {(시각화자료, PPT, 발표자}
자격증
컴퓨터 활용능력
2 | 대한상공회의소
2020.08.
토익 스피킹
IH | ETS
2024.09.
교육
건국대학교
대학교(학사) | 응용통계학과
2022.02. ~ 현재 | 재학 중
학점은행제
대학교(전문학사) | 컴퓨터 네트워크
2020.08. ~ 2021.02. | 졸업