임용택

LLM Engineer

teang19951@gmail.com

경력

셀렉트스타

서울

2024년 11월 - 현재

비글즈

야탑

2024년 3월 - 2024년 11월

스마일게이트 AI센터 (인턴)

판교

인턴

2022년 1월 - 2022년 3월

프리딕션

서울

2021년 5월 - 2021년 9월

캐리큐어

수원

2020년 10월 - 2021년 5월

학력

아주대학교

수원

전자공학과

2015년 3월 - 2021년 2월

학사 졸업

서울시립대학교

서울

인공지능학과

2022년 3월 - 2024년 2월

석사 졸업
지도 교수: 송경우
졸업 논문: 동적마진 할당을 통한 강건한 대조 학습

기술

Tech Stack

Python
PyTorch
Django
Django REST Framework (DRF)
MySQL
MongoDB
Docker
Docker Compose
Git
Jenkins
DVC

프로젝트

셀렉트스타 - LLM Safety / Red-Teaming 자동화 및 취약성 평가 프레임워크

2025년 11월 - 현재

담당 업무
- LLM 안전성 평가를 위한 red-teaming 방법론 및 자동화 파이프라인 설계·구현.
- 유해/정책 위반 가능 요청에 대한 모델 응답, 거절 양상, 취약 경로 분석.
- 문화적 맥락, 지역별 민감성, 도메인별 위험 유형을 반영한 red-teaming 평가 데이터셋 구축.
참여 내용
- 공격 전략과 모델 응답 유형을 구조화하여 red-teaming 실험 결과를 일관되게 분석할 수 있는 평가 체계 설계.
- 반복적인 생성–평가–개선 루프를 통해 공격 프롬프트를 자동 개선하고, 모델별 취약성 탐색 실험 수행.
- 단순 유해 요청 생성이 아니라 문화권, 지역, 도메인에 따라 위험성이 달라지는 사례를 반영한 평가 시나리오 및 benchmark 데이터 구축.
- open-domain, financial, legal, medical 등 도메인별 위험 유형을 구분하고, taxonomy 기반으로 데이터 생성·분류·품질 관리 기준 정리.
- 관련 연구 STAR-Teaming: A Strategy-Response Multiplex Network Approach to Automated LLM Red Teaming을 ACL 2026 Findings에 게재.
- 문화 적응형 red-teaming benchmark 생성 연구 CAGE: A Framework for Culturally Adaptive Red-Teaming Benchmark Generation을 ICLR 2026에 게재/채택.

셀렉트스타 - WBL 버티컬 데이터 구축 및 검증 파이프라인

2025년 8월 - 2025년 10월

담당 업무
- 독자 파운데이션 모델 학습을 위한 과학/법률 버티컬 데이터 생성 파이프라인 설계·구현.
- 생성 데이터의 품질을 확보하기 위한 자동 검증(검인증) 파이프라인 설계·구현.
- 검수자/전문가와의 기준 정렬 및 검수 운영(온보딩/업무 분배/리뷰 루프).
참여 내용
- 법률(세법/행정법 포함) 15,000건, 과학(물리/화학/생물/지구과학/제조공학) 15,000건 규모의 데이터셋 생성 및 구성(싱글턴/멀티턴 포함).
- 법률 답변 구조를 “쟁점 분석–근거–결론”으로 표준화하고, 법령 정합성/구체성/조항 누락/판례 언급/커버리지/논리 흐름/근거 공란 등 도메인별 검증 체크를 파이프라인으로 구현.
- 과학 데이터에 대해 교차 LLM 검토(gpt-5, gemini-pro, deepseek-reasoning), 질문-답변 정렬(alignment) 검증, LaTeX 빌드 검증을 결합한 3중 필터 운영.
- 검수 기준을 점검하며 프롬프트 및 검증 로직을 지속 개선하고, 계약직 2명 온보딩 및 작업 단위 분해/할당, 샘플링 기반 리뷰로 품질·비용·일정 리스크 관리.

셀렉트스타 - 질문/답변 생성 프레임워크(학습 데이터 구축 및 평가 요소 설계)

2025년 5월 - 2025년 9월

담당 업무
- 질문 생성을 위한 모델 학습 데이터 구축 및 모델 학습 지원.
- 생성된 질문의 품질을 평가하기 위한 평가 요소(메트릭) 발굴 및 평가 데이터 기획.
- 질문 품질 약점 분석을 통한 개선 방향 도출.
참여 내용
- 학습용 데이터 구축 후 질문 생성 모델 학습을 수행하고, 생성 질문의 오류/약점을 분석해 평가 포인트를 정의.
- 기존 factual 기반 지표(예: context relevancy)만으로는 질문 만족도를 설명하기 어렵다는 점을 확인하고, “자연스러움”이 품질의 핵심 요인임을 도출.
- 자연스러움 평가 요소로 문법의 중요성을 확인하고, 문법 오류가 주로 “조사/종결어미”에서 발생함을 파악하여 오류 유형화를 설계.
- 조사/종결어미 오류 유형 기반 평가 데이터 구축을 기획했으나, 타 프로젝트 우선순위로 인해 프로토타입 단계에서 마무리.

셀렉트스타 - KT 버티컬 RAG 평가 데이터셋 및 평가 프레임워크 구축

2025년 4월 - 2025년 8월

담당 업무
- 고객사 RAG 평가용 데이터셋 구축을 위한 질문 유형 설계 및 초벌 생성(AI 엔지니어 역할).
- 고객사 언어모델 환경에 맞춘 평가 프레임워크 개발 및 평가 수행 체계 정비.
- 고객사와의 협의를 통한 평가 메트릭 설계 및 기준 정렬.
참여 내용
- RAG 평가 데이터셋에 추천/추론/비교/환각 유도 등 운영 리스크를 반영한 질문 유형을 포함해 평가 범위를 확장.
- Vertical 평가 데이터셋에 내부 지시 준수, 컨텍스트 활용 능력, 수리 추론, 논리 추론 등 모델 핵심 역량 점검 유형을 포함.
- DA(Data Assistant)로 수집된 원천 문서를 기반으로 근거 연결이 가능한 평가 데이터 구축 및 초벌 생성 수행.
- 고객사 모델 특성(입력/출력 포맷, 운영 환경 등)에 맞춰 평가가 가능하도록 프레임워크를 개발하고, 평가 결과 해석 및 활용 기준을 고객사와 정렬.

비글즈 - 하잉

2024년 2월 - 2024년 10월

IOS: LINK
Android: LINK

담당 업무
- chatGPT api를 이용해 다양한 페르소나와의 채팅 서비스 담당.
- 프롬프트 관리 및 소켓 서버 관리 일체 담당.
참여 내용
- 에러 로깅 시스템 구축: DB, Slack 알림, 파일 저장으로 다중 경로 에러 관리.
- GPT-4o-mini 도입으로 모델 사용 비용 절감 및 이미지 전송 기능 구현.
- Jenkins 배포 시 결과를 Slack 알림으로 실시간 확인 가능하도록 개선.

캐리큐어 - 안면 인식 기반 피규어 초안 추천 시스템 구축

2020년 10월 - 2021년 4월

담당 업무
- 피규어 제작을 위한 도면을 처음부터 설계 및 디자인.
- 사진-도면 데이터를 축적하여 자동 유사 사진 검색 기능 구현.
- 새로운 사진 수신 시, 기존 데이터 중 가장 유사한 사진의 도면을 활용해 작업 시간을 효율적으로 단축.
참여 내용
- 기존에 존재하던 얼굴 사진, 3d 도면 데이터 전처리 및 DB화
- arcface, facenet과 같은 모델들을 이용해 모든 사진의 임베딩을 구해 DB에 저장
- DRF (Django Rest Framework)로 REST API 서버 구축
- Docker compose 이용해 서버, DB 컨테이너화하여 관리

비글즈 - 언어모델 학습 및 평가

2024년 2월 - 2024년 10월

담당 업무
- 서비스용 페르소나 데이터를 활용해 채팅 위한 소형 언어 모델(sLLM) 학습 및 운영.
- 데이터 수집 및 자동화, 모델 학습, 평가, 경량화, 배포 등 전체 파이프라인 설계 및 구현.
- 모델 학습부터 배포까지의 워크플로우 구축.
참여 내용
- DVC 이용한 데이터 버저닝 및 전처리.
- 상담 데이터 수집을 위한 업체와의 컨택 및 데이터 품질 관리.
- LlamaFactory 이용한 다양한 모델 (Llama3, Qwen) 등에서의 학습 파이프라인 구축.
- 모델의 답변 생성 퀄리티 위한 자동 대화 생성 파이프라인 구축. (Reference: LINK)
- AWQ Quantization을 통한 추론 시 자원 최적화 및 감소.
- vLLM을 이용한 효율적인 모델 배포 및 관리.

출판물

Culturally-Adapted Red-Teaming Across East and Southeast Asian Contexts: A Methodological and Compar

2026년 4월

Hyeji Choi, Yongtaek Lim, Minwoo Kim, CULTURE x AI 2026 (ICML Workshop)

Reliable to Expressive: A Curriculum for Rubric-Following Safety Judges

2026년 4월

Yongtaek Lim, Hyeji Choi, Minwoo Kim, AIWILD 2026 (ICML Workshop)

STAR-Teaming: A Strategy-Response Multiplex Network Approach to Automated LLM Red Teaming

2026년 3월

Minjae Jung, YongTaek Lim, Chaeyun Kim, Junghwan Kim, Kihyun Kim, Minwoo Kim, ACL 2026 Findings

Efficient Prompt Learning with Knowledge Graph

2026년 1월

Yongtaek Lim, Suho Kang, Yewon Kim, Dokyung Yoon, Jiyoung Jung, Kyungwoo Song, “Efficient Prompt Learning with Knowledge Graph”, PAKDD 2026

CAGE: A Framework for Culturally Adaptive Red-Teaming Benchmark Generation (Under Review)

2025년 12월

Chaeyun Kim, YongTaek Lim, Kihyun Kim, Junghwan Kim, Minwoo Kim, “CAGE: A Framework for Culturally Adaptive Red-Teaming Benchmark Generation”, ICLR 2026

Data Adaptive Stochastic Ensemble Net: Optimizing Infection Predictions for COVID-19 Cluster Analysis

2025년 10월

Sungjun Lim, Yongtaek Lim, Hojun Park, Junggu Lee, Jaehun Jung, Kyungwoo Song, “Data Adaptive Stochastic Ensemble Net: Optimizing Infection Predictions for COVID-19 Cluster Analysis”, JBHI, 2025

COVID-19 Prediction with Doubly Multi-task Gaussian Process

2025년 5월

Sooyon Kim, Yongtaek Lim,Sungjun Lim, Gyeongdeok Seo, Jihee Kim, Hojun Park, Jaehun Jung, Kyungwoo Song, “COVID-19 Prediction with Doubly Multi-task Gaussian Process”, JBHI, 2025

Multi-purpose Technology Commercialization Recommender System with Large-scale Korean Language Model

2025년 5월

Hyeji Hwang, Yongtaek Lim, Changdae Oh, Seungyeon Kim, Eunkyeong Lee, Yunjeong Choi, Sungjin Kim, Hosik Choi, Kyungwoo Song, “Multi-purpose Technology Commercialization Recommender System with Large-scale Korean Language Model”, Journal of Supercomputing, 2025

Technical Domain Question Answering With Large Language Models

2024년 5월

Jihee Kim, Subeen Park, Hakyung Lee, YongTaek Lim, Hyo-won Suh, Kyungwoo Song, “Technical Domain Question Answering With Large Language Models”, IJCAI 2024 Workshop (Large Knowledge-Enhanced Models)

Few-Shot PPG Signal Generation via Guided Diffusion Models

2024년 1월

Jinho Kang, Yongtaek Lim, KyuHyung Kim, Hyeonjeong Lee, KwangYong Kim, Minseong Kim, Jiyoung Jung*, Kyungwoo Song, “Few-Shot PPG Signal Generation via Guided Diffusion Models”, IEEE Sensors, 2024

BlackVIP: Black-Box Visual Prompting for Robust Transfer Learning

2023년 1월

Changdae Oh, Hyeji Hwang, Hee-young Lee, YongTaek Lim, Geunyoung Jung, Jiyoung Jung, Hosik Choi, Kyungwoo Song, “BlackVIP: Black-Box Visual Prompting for Robust Transfer Learning”, CVPR 2023

Geodesic Multi-Modal Mixup for Robust Fine-tuning

2023년 1월

Changdae Oh, Junhyuk So, Hoyoon Byun, YongTaek Lim, Minchul Shin, Jong-June Jeon, Kyungwoo Song, “Geodesic Multi-Modal Mixup for Robust Fine-tuning”, Neurips 2023

Robust Contrastive Learning with Dynamic Mixed Margin

2023년 1월

Junhyuk So, Yongtaek Lim, Yewon Kim, Changdae Oh, Kyungwoo Song, “Robust Contrastive Learning with Dynamic Mixed Margin”, IEEE Access, 2023.