정소미

AI/ML엔지니어 서울 종로구 창성동

1wosxai@gmail.com

プロフィール

AI Engineer 정소미입니다.
  • 사용자 페인포인트를 데이터로 가설 검증하고, AI 솔루션을 설계-검증-배포-운영까지 End to End로 오너십 있게 딜리버리합니다.
  • 해커톤 및 공모전에서 환경부장관상과 영천시장상을 수상하며 문제 정의, 기술 기획, 프로토타이핑, 프로덕션 수준 구현까지 전 과정을 리드했습니다.
  • 컴퓨터 비전, NLP, 멀티모달 등 핵심 AI 스택을 신속히 온보딩해 PoC를 설계하고 제품 워크플로우에 통합하는 실행력을 보유했습니다.

다양한 도메인 문제를 데이터 중심으로 구조화하고, 모델 아키텍처를 설계-학습-검증-서빙까지 운영 자동화합니다. 파이프라인을 모듈화하고 모니터링과 로깅을 체계화해 성능을 지속적으로 튜닝합니다.

반복 작업을 자동화하고 비효율 프로세스를 리팩터링해 처리량과 품질을 안정화했습니다. 데이터 공모전에서는 병렬 처리 파이프라인을 재설계해 총 처리 시간을 32시간에서 1시간 30분으로 단축하고, 리소스 사용률을 최적화했습니다.

프로젝트에서는 PM과 AI Engineer를 겸임해 요구사항을 정제하고 백로그를 우선순위화하며 로드맵을 수립했습니다. 스프린트 운영과 리스크 관리, 이해관계자 커뮤니케이션을 통해 SLA와 마일스톤을 준수했습니다.

신규 기술을 빠르게 학습해 실무에 적용하고, 웹 개발과 컴퓨터 비전, NLP, 멀티모달 AI 전 주기에서 데이터 엔지니어링, 모델링, MLOps, 배포까지 수행합니다. 앞으로도 AI 기술로 사회적 가치를 확장하는 엔지니어로 성장하겠습니다.

職務経歴

SK이노베이션

mySUNI Lx & Tech 팀원

Sep. 2025 - 現在

  • AI 에이전트 아키텍처를 설계하고 프로덕션에 배포
  • LMS 운영 워크플로를 자동화하고 AI 기능을 내재화
  • LLM 기반 자동화 시스템 개발
    • GPT, Claude, Gemini를 통합한 멀티-LLM 오케스트레이션 프레임워크 설계-구현: 토큰 예산 기반 라우팅, 응답 캐시 계층 도입
    • LLM 강화 STT 자막 자동 교정 파이프라인을 구축해 수작업 검수 시간을 대폭 절감
  • AI 자율 판단 크롤링 에이전트 시스템 설계
    • 단일 URL 입력만으로 DOM을 파싱하고 크롤러 코드를 자동 생성하는 자율 에이전트 아키텍처 설계
    • 다중 교육 플랫폼 대상 대규모 데이터 수집 파이프라인을 설계-운영
  • 글로벌 콘텐츠 번역 프로젝트 (1,500개+ 강의)
    • SRT 1,500건+ 한-일 번역을 처리하고 860건+ 품질 이슈를 교정, 12개 도메인 용어집을 구축
    • OCR 기반 이미지 텍스트 추출, HTML i18n, 자동 품질 검증을 포함한 웹 번역 CI 파이프라인을 구현
  • LMS 코드베이스 내재화 (19개 마이크로서비스)
    • 문서 부재 환경에서 리버스 엔지니어링으로 아키텍처를 복원하고 로컬 독립 개발 환경을 프로비저닝
    • 외부 의존성을 제거하고 팀 내 CI 빌드-테스트 파이프라인을 정립
  • 데이터 분석 자동화
    • 25개 멤버사 학습 데이터를 위한 ETL 파이프라인을 구축하고 리포팅을 자동화
    • 이벤트 예산-발주 워크플로를 자동화하고 프로모션 데이터 검증 규칙 엔진을 구현

한국전자통신연구원

AI/ML연구원

Jul. 2023 - Sep. 2023

  • CCTV 기반 실시간 불법투기 감지-예측 통합 모니터링 시스템을 설계-구현
  • YOLOv5x를 커스터마이즈해 학습-추론 파이프라인을 최적화: 쓰레기/인간 클래스 정밀 식별 향상
  • SORT + Kalman Filter 기반 실시간 멀티 오브젝트 트래킹 모듈을 구현
  • Hungarian 알고리즘으로 ID 재할당 및 동적 경로 예측 엔진을 개발
  • 프라이버시 보존 처리를 구현해 시간대별 분석 파이프라인과 실시간 동적 블러링을 적용

学歴

한양대학교 인공지능융합대학원

인공지능시스템학과

Sep. 2025 - 現在

석사과정 수학 중

국립안동대학교

컴퓨터공학과 / 복수전공 미래차융합전공

Mar. 2021 - Feb. 2025

  • GPA: 4.15/4.5
  • 학사 졸업

영남이공대학교

간호학과(4년제)

Mar. 2019 - Dec. 2020

  • GPA: 4.1/4.5
  • 자퇴

スキル

Programming Languages

  • Python (상급: 타입 힌팅, asyncio, 멀티프로세싱, 프로파일링 및 성능 최적화, 패키지 배포)
  • Java (중급: Spring 기반 애플리케이션 개발, 스트림 API, 기본 JVM 튜닝 및 메모리 모델 이해)
  • SQL (상급: 쿼리 최적화, 인덱스 설계, 윈도 함수와 CTE, 트랜잭션 격리수준 및 락 튜닝)

AI/ML Frameworks

  • PyTorch (상급: 커스텀 모듈 및 레이어 구현, AMP 혼합정밀도, DDP 분산학습, TorchScript 및 ONNX 내보내기)
  • TensorFlow (중급: tf.data 입력 파이프라인, Keras 서브클래싱, 모델 서빙 및 TFLite 변환)
  • Keras (중급: 콜백/커스텀 로스 구현, 전이학습 파이프라인 구성)
  • Pandas, Numpy (상급: 벡터화 연산, 메모리 최적화, 결측처리 및 피처 엔지니어링)
  • Matplotlib (상급: 시각화 자동화, 대시보드용 플로팅 템플릿화, 출판 품질 그래프 제작)

Computer Vision & NLP

  • 컴퓨터비전 (YOLO, OpenCV, Grounding DINO 등: 객체탐지·세그멘테이션 파이프라인 구축, 어노테이션 자동화, TensorRT/ONNX 최적화 및 실시간 추론)
  • NLP (LLM, LangChain, HuggingFace Transformers 등: 프롬프트 엔지니어링, 지식증강 RAG 설계, 파인튜닝 및 파라미터 효율 학습)
  • OCR, 음성처리, RAG, 멀티모달 AI (OCR: CTC/CRNN, 음성: ASR/TTS, 멀티모달: CLIP/BLIP/LLaVA 기반 통합 파이프라인 구축)

DevOps & Cloud

  • AWS, Azure, GCP (중급: IAM 및 VPC 설계, 객체 스토리지 운영, 서버리스(Lambda/Functions)와 Cloud Run, SageMaker 기초 운영)
  • Docker, Kubernetes, ROS (컨테이너 이미지 최적화, Helm 배포, GPU 스케줄링, CI/CD 파이프라인 구성, ROS 노드 패키징 및 배포)

Data Engineering & Big Data

  • Spark (중급: Spark SQL 및 DataFrame API, Catalyst 최적화 이해, 셔플 최소화와 분산 조인 전략, PySpark 튜닝)
  • SQL, 데이터 파이프라인 구축 (Airflow·dbt·Kafka 기반 ETL/ELT, CDC 파이프라인, 데이터 품질 검증 및 모니터링)

受賞

2025 대국민 지하수 빅데이터 공모전 최우수상

환경부

지능형 오염원 통합 추적 플랫폼: 지하수 빅데이터 기반 오염원 추적 알고리즘 설계 및 통합 관제 대시보드 구현 - 환경부장관상 최우수상 수상

Jul. 2025

2025년 대구시 공공데이터 활용 창업경진대회, 입상

대구디지털혁신진흥원

공공데이터 기반 서비스 아이디어 기획 및 시연으로 입상

Aug. 2025

WISET AI 데이터분석과정 우수상

멋쟁이사자처럼,WISET

AI 미술품 도슨트 RAG 시스템 ARTIQUE 설계 및 엔드투엔드 개발

Jun. 2025

한국정보기술학회 대학생논문경진대회 금상

한국정보기술학회

시각장애인 보행 안전 강화를 위한 Few-shot Learning과 Grounding DINO 통합 기반 YOLO 최적화 프레임워크 제안 및 성능 검증 (주저자)

Jun. 2024

한국정보기술학회 대학생논문경진대회 금상

한국정보기술학회

YOLOv8-CNN-LSTM 기반 실시간 위험 감지·예측 시스템 설계 및 온라인 추론 파이프라인 구현 (주저자)

Jun. 2024

한국정보기술학회 대학생논문경진대회 동상

한국정보기술학회

자율주행 차량 안전 강화를 위한 멀티모달 상황 인식 및 컨텍스트 추론 모델 설계와 실험적 검증 (주저자)

Jun. 2024

한국정보기술학회 대학생논문경진대회 동상

한국정보기술학회

LLM-RAG 기반 실시간 개인화 여행지 추천 웹 서비스 아키텍처 설계 및 프로토타입 구현 (주저자)

Jun. 2024

한국정보기술학회 대학생논문경진대회 동상

한국정보기술학회

자율주행 환경 인식을 위한 도메인 특화 데이터 증강 기법과 Vision Transformer 기반 이미지 분류 모델 개발

Jun. 2024

제 4회 스마트 SW.AI 경진대회 장려상

국립안동대,국립순천대 SW융합교육원

RAG 시스템 기반 식물 관리 웹 애플리케이션 아키텍처 설계 및 프론트엔드-백엔드 통합 개발

Jun. 2024

2024년 제3회 영천시 공공데이터 활용 경진대회 영천시장상

영천시,포항테크노파크

자연어처리(NLP) 기반 식물 케어 관리 애플리케이션 아이디어 기획 및 요구사항 정의

Jun. 2024

한국멀티미디어학회 BEST PAPER AWARD

한국멀티미디어학회

데이터 증강을 활용한 과수농장 침입 유해조류 객체 탐지 모델 제안 및 성능 향상 연구 (주저자)

May. 2024

オープンソース

Hugging Face LeRobot 국제화(i18n) 오픈소스 기여

  • Hugging Face LeRobot(로보틱스 파운데이션 모델 라이브러리) 문서에 대한 최초 i18n 이슈를 개설하고 범위를 정의 및 트래킹(#3058)
  • React - TypeScript - Tailwind 기반 풀스택 대시보드를 설계 및 구현하고 GitHub REST API를 직접 통합
  • Supabase Edge Functions로 안전한 API 프록시를 구현하고 i18next로 다국어 UI(4개 언어)를 국제화
  • 성과: Hugging Face 팀이 v0.6.0 공식 Community Roadmap(#3134) i18n 섹션에서 대시보드를 canonical tracker로 채택하고 한국어 및 중국어 번역 이슈의 공식 인프라로 활용, 한국어 번역 PR 9건 직접 제출(+1,569 LOC)
  • GitHub Issue
  • 공식 Roadmap 등재
  • Dashboard

Mar. 2026 - Apr. 2026

Kubernetes 오픈소스 기여 (한글화)

  • kubernetes/website 저장소에 한국어 로컬라이제이션 PR을 제출하고 리뷰 피드백을 반영(#54481)
  • 공식 용어집을 준수해 기술 용어 표기를 표준화하고 문서 접근성을 개선
  • GitHub PR

Feb. 2026 - Apr. 2026

Apache Airflow 오픈소스 기여 (한글화)

  • Airflow UI 미번역 문자열을 보강하고 용어 표기를 표준화하여 PR #61762 머지
  • 리뷰 피드백을 신속 반영해 번역 품질과 일관성을 향상
  • GitHub

Feb. 2026 - Feb. 2026

Next.js 한국어 문서화 오픈소스 기여

Jul. 2023 - Jul. 2023

プロジェクト

BridgeCast AI - Microsoft × Women in Cloud

Full-stack Lead

Mar. 2026 - Mar. 2026

  • KR-TW 국제 공동팀과 실시간 수어-음성 양방향 통역 플랫폼 아키텍처를 설계하고 핵심 모듈을 구현
  • 음성-to-Sign 3D 아바타 생성 및 Sign-to-Speech 합성 파이프라인을 실시간으로 설계·엔지니어링
  • Azure 15개 매니지드 서비스를 오케스트레이션하고 Uni-Sign 수어 인식 모델을 Azure GPU VM에 컨테이너라이즈해 배포, Three.js 기반 리얼타임 3D 아바타 렌더링 구현
  • Responsible AI 거버넌스를 수립하고 위험 평가·데이터 거버넌스·프롬프트 가드레일·모델 모니터링 정책을 문서화하여 코드 레벨로 적용
  • GitHub

Shellter - 전세사기 예방 법률 자문 챗봇

AI 시스템 설계 및 개발 총괄 / PM

Aug. 2025 - Aug. 2025

  • E2E 인텔리전트 리걸테크 플랫폼 아키텍처를 설계하고 규칙 기반 엔진과 LLM 하이브리드 인퍼런스 파이프라인을 구축
  • 멀티포맷 OCR 파이프라인을 구성하여 문서 정규화·파싱을 자동화하고 실시간 법률 QA 챗봇을 프로덕션화, 다국어 NMT 파이프라인을 연계
  • 보증금 반환·권리관계·수선의무 등 9대 리스크 자동 추론 규칙세트와 피처 엔지니어링 알고리즘을 설계·검증
  • NVIDIA × 경기도 경제과학진흥원 팀 프로젝트 2등 수상
  • GitHub

2025 지하수 빅데이터 공모전, 샘났다 팀

AI 모델링 리드 / PM

Jun. 2025 - Jul. 2025

  • 환경부 전국 오염원 조사자료와 국가지하수정보센터 데이터를 통합하여 오염원 위치 추정 및 원인 규명 자동화 파이프라인을 설계·배포
  • MODFLOW 수리지질 모델과 GNN 기반 딥러닝을 엔드투엔드로 결합한 물리-ML 하이브리드 모델을 구축
  • Streamlit 운영 대시보드를 구현하고 국내 최초 수준의 수리 모델+GNN 통합 분석 워크플로우를 완성

ARTIQUE - AI 미술품 도슨트 RAG 시스템

AI 모델링 리드 / PM

May. 2025 - Jun. 2025

  • 멀티모달 도슨트 서비스의 요구사항을 정의하고 PoC를 설계·구현하여 감상 및 경매 투자 의사결정을 지원
  • LightGBM 기반 낙찰가 회귀 모델을 개발하고 PaliGemma/BLIP-Large로 멀티모달 RAG 도슨트 PoC를 제작
  • GitHub

GemmArte

Sep. 2024 - Oct. 2024

  • PaliGemma 기반 도메인 특화 비전-랭귀지 모델을 파인튜닝하고 배포 파이프라인을 구성
  • 다국어 NMT 파이프라인을 설계하고 지연시간을 최적화하여 미술 분석 번역 효율을 향상
  • HuggingFace Painting-Form 데이터셋을 기반으로 13,812개 이미지와 224,850개 QA 페어 ETL 및 학습 파이프라인을 자동화
  • 모델 허브
  • GitHub

박물관 도슨트

AI 개발 리드 / PM

Aug. 2024 - Aug. 2024

  • 생성형 AI 기반 맞춤형 박물관 도슨트 서비스 아키텍처를 설계·개발
  • RAG 파이프라인을 구축해 신뢰도를 보강하고 환각을 저감하는 컨텍스트 증강 전략을 적용
  • ChromaDB 벡터 스토어로 컬렉션을 구성하고 CSV 인제스트 및 임베딩 검색을 구현
  • 2024 SW중심대학 영남권 연합 해커톤 대회 대상 수상
  • GitHub

資格

Generative AI with Azure OpenAI and Semantic Kernel

Microsoft

Mar. 2026

Innovation Challenge Hackathon - March 2026

Microsoft Americas Azure Team

Mar. 2026

NVIDIA Certified Associate - Multimodal Generative AI

NVIDIA

Nov. 2025

Building LLM Applications with Prompt Engineering

NVIDIA

Aug. 2025

Building Retrieval-Augmented Generation (RAG) Agents with LLMs

NVIDIA

Aug. 2025

Building Transformer-Based Natural Language Processing Applications

NVIDIA

Aug. 2025

Efficient Large Language Model (LLM) Customization

NVIDIA

Aug. 2025

Generative AI with Diffusion Models

NVIDIA

Aug. 2025

Google Analytics Individual Qualification (GA4)

Google

Aug. 2025

Rapid Application Development with Large Language Models

NVIDIA

Aug. 2025

Building Agentic AI Applications with LLMs

NVIDIA

Aug. 2025

Computer Vision for Industrial Inspection

NVIDIA

Aug. 2025

TOPA 1급

한국표준협회,엘리스

Jul. 2025

IBM AI Developer Professional Certificate

IBM

Apr. 2025

IBM AI Engineering Professional Certificate

IBM

Apr. 2025

IBM Data Engineering Professional Certificate

IBM

Apr. 2025

IBM Generative AI Engineering Professional Certificate

IBM

Apr. 2025

IBM Machine Learning Professional Certificate

IBM

Apr. 2025

SQL 개발자(SQLD)

한국데이터산업진흥원

Apr. 2025

Getting Started with AI on Jetson Nano

NVIDIA

Jul. 2024

Azure AI Fundamentals (AI-900)

Microsoft

May. 2024

Fundamentals of Deep Learning

NVIDIA

May. 2023

Azure Fundamentals (AZ-900)

Microsoft

Feb. 2023

連絡先

メール

1wosxai@gmail.com

GitHub

1wos

LinkedIn

someee

ウェブサイト

https://somi-pied.vercel.app/