채용공고 올리기

이민재님을 응원해보세요!

이직/구직 중이에요

미리보기

기본 정보

이름
이민재
직업
데이터 엔지니어
간단 소개

데이터의 핵심 가치를 실현하고 데이터 흐름을 원활하게 관리하며 서비스 제공에 필요한 정보를 효율적으로 처리하는 데이터 엔지니어가 되고자 합니다.

기술 스택

기술 스택

Python, SQL, Apache Spark, FastAPI, Airflow, MySQL, Docker, aws-rds, s3, ec2, github-actions, Git, Linux

프로젝트

프로젝트명

LINCOOK

소속/기관명

개인(팀)

프로젝트 기간

2023.08. ~ 2023.10.

프로젝트 내용

유튜브에서 보고 있는 요리 레시피에 사용되는 재료를 현재 내 주변 마트에서 저렴한 가격에 구매할 수 있는지를 사용자에게 한눈에 제공하는 서비스를 구현

  • 주요 역할

    • 대용량 데이터 / 실시간 크롤링 파이프라인 구축
    • 데이터 파이프 라인 자동화 및 스케줄링
    • 데이터 파이프 라인 CI/CD 구축
    • 프론트 배포 및 QC
    • 클라우드(AWS) 배포
  • 주요 성과

    유용한 요리 재료 가격 비교 서비스를 구현
    데이터 수집 및 전 처리 과정을 단축 (5시간 → 1시간 30분)
    데이터 수집 및 처리 과정의 자동화 및 정확도 향상
    실시간 데이터 크롤링 서버를 구축
    CI/CD 파이프라인을 구축으로 개발 및 배포 프로세스를 효율화하고 안정성을 확보
    클라우드 환경으로 프로젝트를 배포하여 확장성을 확보하고 서비스 안정성을 확보
    지속적인 팀원간 피드백을 통한 기능 변경 및 효율성 증가

프로젝트명

기상상태에 따른 울산 지역 닻 끌림 발생 여부 분석

소속/기관명

개인(팀)

프로젝트 기간

2023.06. ~ 2023.06.

프로젝트 내용

물리적 모델링을 활용하여 기상 조건과 닻 끌림 발생 여부 간의 관계를 탐구하며, 이를 예측 모델로 구현하는 프로젝트를 수행

  • 주요 역할

    선박 데이터(시계열 데이터) 전처리
    앙상블 모델 설계
    모델 성능별 비교
    하이퍼 파라미터 튜닝

  • 주요 성과

    선박 방향 인코딩 및 결측치 처리를 통한 적절한 데이터 전처리
    다양한 전처리 방법과 앙상블(Ensemble)이용으로 과적합(Overfitting) 해결
    모델의 가중치에 가장 큰 영향을 미치는 변수를 식별하여 모델 개선에 기여

프로젝트명

CAFA 5 Protein Function Prediction

소속/기관명

개인(팀)

프로젝트 기간

2023.06. ~ 2023.08.

프로젝트 내용

서열 유사성 검색과 머신러닝 or 딥러닝 기법을 활용하여 최적의 단백질 기능 예측 모델을 구현 (Kaggle Competition)

  • 주요 역할

    서열 유사성 검색과 딥러닝 기법을 결합한 복잡한 예측 모델의 구현
    Pro-BERT, T5, LSTM 등의 딥러닝 아키텍처를 활용한 모델 설계 및 학습
    모델의 성능을 향상시키기 위해 파라미터 튜닝과 함수 변경 작업을 지속적으로 수행.

  • 주요 성과

    1. 아미노산 서열을 이용한 단백질 기능 모델 구축 완료
    2. 파라미터 및 함수 변경을 통한 정확도 상승.

포트폴리오

URL

link

포트폴리오

노션

교육

소속/기관명

플레이데이터

종류 | 전공

사설 교육 | 빅데이터 트랙

재학 기간 | 재학 상태

2023.04. ~ 2023.10. | 졸업

소속/기관명

울산대학교

종류 | 전공

대학교(학사) | 생명과학부

재학 기간 | 재학 상태

2017.03. ~ 2022.02. | 졸업

댓글