미리보기
기본 정보

안녕하세요, 학습하고 최적화하는 엔지니어, 이현정 입니다. - 3년차 AI 엔지니어로 LLM과 AI 상담 서비스를 개발/배포하였습니다. - 클라우드 서버와 멀티 GPU 환경에서 LLM을 개발하였습니다. - FSDP, DeepSpeed 등의 분산 학습 기법과 LoRA, 양자화와 같은 모델 경량화 기법을 적용하여 효율적인 모델 학습을 수행하였습니다. - 사전학습부터 파인튜닝, 강화학습까지 LLM 개발의 모든 단계를 다루었으며, 학습에 필요한 데이터를 자체 제작한 경험이 있습니다.
기술 스택
Python, 머신러닝, 빅데이터, 인공지능(AI), ChatGPT, 딥러닝, Linux, Docker, Pandas, 생성형AI, LLM, 프롬프트엔지니어링, PyTorch, 챗봇
경력
주식회사 딥로딩
AI 엔지니어 | AI솔루션팀 | 재직 중
2023.01. ~ 재직 중 (2년 2개월)
한국지능정보사회진흥원(NIA) 인공지능 학습용 데이터 구축 사업에 참여하여 AI 상담 서비스, sLLM, 벤치마크 데이터 테스트 시스템 등을 개발하였습니다.
RAG 기반 챗봇 개발: LLM, OpenAI API, RAG 기법을 활용하여 챗봇의 출력을 최적화
클라우드 서버 기반 개발 환경 구축: AWS EC2, GCP VM 서비스 기반 멀티 GPU 서버
LLM 학습용 데이터 제작: API, 프롬프트 엔지니어링으로 모델 학습용 데이터 제작하는 자동화 프로그램 개발
LLM 학습: 사전학습, 파인튜닝, DPO 알고리즘으로 학습하여 모델 성능 향상
LLM 평가용 데이터 제작: API, 프롬프트 엔지니어링으로 모델 성능평가용 데이터 제작하는 자동화 프로그램 개발
LLM 평가: 벤치마크 데이터로 모델 성능 평가
LLM 배포: Docker 컨테이너로 모델 배포
주식회사 딥로딩
인턴 | AI솔루션팀
2022.09. ~ 2022.12. (4개월)
한국지능정보사회진흥원(NIA) 인공지능 학습용 데이터 구축 사업에 참여하여 AI 모델을 개발하였습니다.
데이터 전처리: 파이썬 라이브러리를 이용하여 텍스트, 오디오 데이터 전처리
AI모델 학습: 기계번역, 음성인식 모델 학습
AI모델 평가: BLEU score, CER 평가지표로 모델 평가
프로젝트
베트남어 AI 상담 서비스 개발 (정부 공동개발)
주식회사 딥로딩
2024.07. ~ 2024.12.
[사용기술]
RAG, VectorDB, Web Interface, Fine-Tuning, Python
[역할]
베트남 유학생, 근로자를 대상으로 한 한국 유학, 체류, 비자 발급을 상담하는 챗봇 서비스를 개발
1) AI 상담 서비스 개발
LLM(Meta의 Llama 3.1 8B 모델), OpenAI API을 활용
RAG 기법을 사용하여 챗봇의 출력을 최적화
2) 웹 인터페이스 개발
시연 및 만족도 조사에 활용
[성과]
외국인 근로자 만족도 평가 60% 달성
카자흐스탄 LLM 개발 (정부 공동개발)
주식회사 딥로딩
2024.07. ~ 2024.12.
[사용기술]
Instruct-tuning, Prompt engineering, Docker, Python
[역할]
한국과 카자흐스탄 정부 공동 협력과제 IT 협업 프로젝트의 LLM 개발 담당으로 참여
1) LLM 학습용 데이터 제작
Instruction Q/A 데이터 자동 제작 프로그램 개발
프롬프트 엔지니어링, OpenAI API 활용
2) LLM 학습
Llama 3.1 8B 모델을 파인튜닝하여 성능 향상
4x NVIDIA A100 GPU 서버를 활용
3) LLM 평가용 데이터 제작
벤치마크 데이터 자동 제작 프로그램 개발
프롬프트 엔지니어링, OpenAI API 활용
4) LLM 성능 평가
상식 수준을 평가하는 MMLU 50% 달성
문맥 이해력을 평가하는 Hellaswag 53% 달성
5) LLM 배포
Docker 컨테이너 활용
6) 연수 프로그램 참여
한-카자흐스탄 국내 연수 프로그램의 모델 개발 실무 설명 교육 담당
[성과]
벤치마크 점수 MMLU 50%, Hellaswag 53% 달성
베트남어 벤치마크데이터 테스트 시스템 개발
주식회사 딥로딩
2024.08. ~ 2024.12.
[사용기술]
Prompt engineering, LLM Benchmarking, Python
[역할]
베트남어 벤치마크 데이터 구축 사업에 참여하여 벤치마크 데이터셋을 테스트하는 시스템을 개발
MMLU, Hellaswag, HHH 등 LLM 성능을 평가하는 벤치마크 데이터에 대하여 적용
OpenAI API, Llama 모델 등 다양한 API와 모델을 활용
[성과]
7개 벤치마크 데이터에 대한 자동화 테스트 시스템 개발
베트남어 LLM 개발
주식회사 딥로딩
2023.07. ~ 2023.12.
[사용기술]
Pre-training, Fine-tuning, DPO, Prompt engineering, Docker, Python
[역할]
인공지능 학습용 데이터 구축 사업에 참여하여 베트남어 LLM을 개발
1) LLM 학습용 데이터 제작
학습용 말뭉치 데이터 제작
Q/A 데이터 자동 제작 프로그램 개발
프롬프트 엔지니어링, OpenAI API 활용
2) LLM 학습
대규모 말뭉치 Pre-training (사전학습)
Fine-tuning을 통해 성능 향상
DPO를 통해 학습시간 단축 및 LLM 강화
AWS EC2, GCP VM 서비스 클라우드 서버를 활용
3) LLM 성능 평가
SSA 60% 달성
4) LLM 배포
Docker 컨테이너 활용
[성과]
품질 지표 SSA 60% 달성
은어, 속어 번역 모델 개발
주식회사 딥로딩
2022.09. ~ 2022.12.
[사용기술]
기계번역, Python
[역할]
인공지능 학습용 데이터 구축 사업에 참여하여 은어, 속어를 표준어로 번역하는 모델을 개발
1) 데이터 전처리
파이썬 라이브러리를 이용하여 텍스트 파일 전처리
2) LLM 학습
BART 모델을 파인튜닝하여 기계번역 성능 향상
말뭉치로 토크나이저를 학습하여 활용
3) LLM 평가
기계번역 성능을 평가하는 BLEU score 86.9 달성
[성과]
BLEU score 86.9 달성
은어, 속어 음성인식 모델 개발
주식회사 딥로딩
2022.09. ~ 2022.12.
[사용기술]
ASR(Automatic Speech Recognition), STT(Speech-to-text), Python
[역할]
인공지능 학습용 데이터 구축 사업에 참여하여 은어, 속어를 표준어로 음성 인식하는 모델을 개발
1) 데이터 전처리
파이썬 라이브러리를 이용하여 오디오 파일 전처리
2) STT 모델 학습
Wav2vec 2.0 모델을 학습하여 음성 인식 성능 향상
말뭉치로 토크나이저를 제작하여 활용
3) STT 모델 평가
음성 인식 성능을 평가하는 CER 13 달성
[성과]
CER 13 달성
포트폴리오
외국어
영어
비즈니스 회화 가능
교육
한국외국어대학교
대학교(학사) | 컴퓨터전자시스템공학부
2018.03. ~ 2023.02. | 졸업
분당 대진고등학교
고등학교
2016.03. ~ 2018.02. | 졸업
자격증
OPIc
IH | ACTFL
2024.12.