
박민수
kocory1@naver.com
비즈니스 문제를 데이터와 모델링으로 해결하는 Forward Deployed Engineer를 목표로 합니다.
문제 정의와 가설 설정, 모델 선택과 검증, 서비스화와 운영 모니터링까지의 전 과정을 유기적으로 연결하는 역할에 관심이 많습니다.
AI Agent와 LLM 기반 솔루션, RAG, Function Calling, Multi-Agent 등 최신 기술 동향을 적극적으로 학습하며 실무 적용 관점을 꾸준히 확장하고 있습니다.
경 력
솔브레인
AI-TF 계약직 인턴
2026년 1월 - 현재
[DataUI & ML Agent]
개인별로 흩어져 ML 적용이 불가능했던 연구 데이터를, 비전문가도 분석 가능하게 만든 ML 플랫폼
[Pain Point]
개인별로 사일로화된 연구 데이터, 통일되지 않은 엑셀 형식으로 인해 실험 설계에 많은 시간 소요
연구원들의 머신러닝 역량 부족으로 인한 실험 결과 예측 불가능
[Solution]
openpyxl & LLM 기반 엑셀 데이터 정형화 파이프라인 구축
엑셀 데이터를 Long 형식으로 저장하여 Data 축적성 향상
Grid Search를 통한 R 기반 RandomForest AutoML 구축
[Impact]
Target Etch Rate를 만족하기 위한 식각액 1차 실험 설계 간결화
전처리~모델링 까지의 파이프라인을 버튼 클릭만으로 실행할 수 있는 서비스 개발
모델링 결과를 설명하는 AI Report를 통해 비전공자 연구원이 이해할 수 있는 머신러닝 툴 개발
Stack : Python, R, FastAPI, React, Parquet, LangChain
[PPT Assistant]
사내 AI 플랫폼에 부재했던 PPT 자동 생성 기능을 제공한 LLM 에이전트
Details
[Pain Point]
기존 사내 챗봇 서비스(OpenWebUI) 내에 PPT 생성 기능 부재
OpenWebUI의 Source 직접 수정 불가능
[Solution]
OpenWebUI의 Pipe + 별도 LangGraph Agent Server로 우회
유저 요청을 PPT 생성/일반 질의로 분기하는 라우터, 페이지 별 병렬 생성 파이프라인 설계
Image 필요 여부를 페이지 별로 판단하는 라우터 설계
최신 정보가 필요할 경우 Perplexity API를 활용하도록 설계
[Impact]
사내 특화 챗봇 모델 사용량 1위 달성 | 매달 대화 세션 142개 (사용자 470명)
Stack : Python, LangGraph, FastAPI, Freepik API, Perplexity API
프로젝트
AutoFolio - Github 기반 자기소개서 임베딩
Sejong RCV Lab (2명)
LangGraph 구조 설계 및 구현
2026년 1월 - 2026년 4월
GitHub 디렉터리 구조 기반 계층적 임베딩으로 자소서를 작성·첨삭하는 RAG 에이전트
Details
[Pain Point]
일반 RAG는 자소서 같은 문서의 계층적·맥락적 구조를 평탄화해서 검색 정확도 한계
합격 자소서 데이터의 비정형성으로 직접 활용 어려움
[Solution]
RAPTOR 논문 아이디어 응용 → GitHub 디렉터리 구조를 계층적 임베딩으로 변환
LangGraph 기반 작성 에이전트 / 첨삭 에이전트 분리 설계 (Multi-Agent)
합격 자소서 크롤링 → DB화 → RAG 파이프라인 구축
[Impact]
RAPTOR 논문 아이디어를 학부 수준에서 구현 가능한 형태로 단순화
GitHub 디렉터리 구조라는 새로운 도메인에 적용
RAG·LangGraph·Multi-Agent·크롤링 파이프라인을 하나의 프로덕트로 통합 경험
Stack : Python, FastAPI, LangGraph, LangChain, ChromaDB
온식구 - 가족 화합을 돕는 1일 1질문 서비스
온식구 (3인)
AI 백엔드
2025년 6월 - 2026년 3월
가족 대화 기록 기반 개인화 후속 질문·요약을 제공하는 RAG AI 서버
[Pain Point]
가족 간 대화가 형식적·반복적으로 흘러 깊이 있는 소통 단절
단순 청킹 RAG는 질문 맥락을 무시해 중복·진부한 후속 질문 생성
[Solution]
가족/멤버별 과거 Q&A를 ChromaDB 기반 벡터 검색(RAG)으로 개인화 후속 질문 생성
이중 RAG + Self-Consistency 도입으로 중복 질문 24% 감소
매 요청마다 모델·DB 초기화 비효율을 FastAPI Lifespan + 싱글톤 패턴으로 해결
동기 DB 한계를 Python 비동기 원리 학습 후 Thread Pool 방식으로 직접 최적화
Clean Architecture (Domain·Application·Infrastructure·Presentation) 4계층 분리
[Impact]
중복 질문 24% 감소로 가족 대화 다양성 확보
Stack : Python, FastAPI, LangChain, OpenAI, ChromaDB, Docker, AWS EC2
이곡저곡 - 플레이리스트 추천 시스템
개인
세션 기반 플레이리스트 추천 풀스택 서비스 (0→1 단독 구축)
[Pain Point]
일반 추천은 청취 순서·맥락 무시한 정적 추천이라 "다음 곡" 추천 약함
Spotify Million Playlist는 팝송 위주로 국내 사용자 니즈 미충족
두 데이터셋(Spotify·Melon)의 item_id 체계 달라 병합 불가
Transformer 계열 SASRec 학습에 필요한 GPU 자원이 로컬 환경으로 감당 불가
[Solution]
Spotify API 활용 ID 매핑 파이프라인 구축
Melon 메타정보 → Spotify ID 매칭으로 115만 건 통합 데이터셋 구축
RunPod GPU 인스턴스 대여, Transformer 계열 모델 End-to-End 학습 수행
GRU4Rec vs SASRec 성능 비교 후 SASRec 채택, MRR@10 0.7140 → 0.9390 (31% 향상, MostPOP Baseline 대비)
추론 시 행렬 연산 병목을 FAISS 벡터 인덱싱으로 대체, Latency 125ms → 7ms (95% 단축)
[Impact]
모델 비교·학습·서빙·재생까지 추천 시스템 전 과정 단독 경험
Stack : Python, PyTorch, SASRec, FAISS, Docker, Runpod
학력
세종대학교
서울시 광진구
생명시스템학부 바이오융합공학전공 | 컴퓨터공학 (복수전공)
2021년 2월 - 2026년 7월
GPA : 3.82/4.5
수상
세종대학교 코딩경시대회
세종대학교
전체 2등 | 비전공자 부문 1등 수상
2025년 9월
한이음 ICT 공모전
한국정보산업연합회
공모전 참여 대상 선정
2025년 1월
자격증
SQLD
한국데이터산업진흥원
2025년 8월
ADsP
한국데이터산업진흥원
2025년 8월
Machine Learning Specialization
DeepLearning.AI
2025년 7월
어학
TOEIC 795
YBM
2025년 6월
TOEIC Speaking IH
YBM
2026년 4월
대외활동
온톨로지 스터디 (2026.04~2026.05)
재난 예측 DB 구현 및 시각화
GPTSqure
2026년 4월
온톨로지/팔란티어 파운드리 - 판단을 설계하라 저자 '이현종' 주관 온톨로지 스터디 참여
RF 임계치 기반 State 계산 DB 구축 (Mock-up data) 및 시각화
만들면서 배우는 AI 에이전트 개발 입문+실전 베타리뷰어
기술 검수 및 오타 교정
한빛미디어
2026년 4월