SeungHo, Choi

Data Engineer

@ Neowiz

About Me

데이터 생성부터 소비까지 End-to-End를 책임지는 4년차 데이터 엔지니어입니다.
게임 산업에서 일 4,000만 건의 데이터를 안정적으로 처리하며, 실시간 데이터 파이프라인부터 AI/ML 인프라까지 구축해왔습니다.

비용 효율성과 안정성을 동시에 추구하는 것이 저의 강점입니다.
AWS 크레딧 $34K 확보, 월 $1,000+ 비용 절감, 99.9% 데이터 정합성 달성 등
기술적 우수성을 비즈니스 가치로 전환하는 능력을 입증해왔습니다.

단순한 데이터 파이프라인 구축을 넘어, 조직의 데이터 문화를 혁신하는 것이 목표입니다.
LLM 기반 Text-to-SQL로 데이터 추출 요청 70% 감소, 자동화를 통한 운영 리소스 90% 절감 등
기술로 사람과 조직의 생산성을 극대화하는 데이터 엔지니어입니다.

Experience

Data Engineer

Neowiz

2022.01 - Present

게임 데이터 플랫폼 설계 및 운영, 실시간 데이터 파이프라인 구축

  • 🏗️ 멀티클라우드 실시간 데이터 파이프라인 구축 (AWS ↔ GCP, 일 4,000만 건 처리)
  • 💰 인프라 비용 최적화로 월 $1,000+ 절감 및 AWS 크레딧 $34K 확보
  • 🤖 LLM 기반 Text-to-SQL 시스템으로 데이터 추출 요청 70% 감소
  • 📊 Redshift 멀티클러스터 아키텍처 설계로 성능 병목 해결
  • ⚡ 자동화 및 모니터링 시스템으로 운영 리소스 90% 절감
  • 🔄 15개 이상 다양한 데이터 소스 통합 및 실시간 ETL 구축

Projects

Multi-Cloud Real-time Data Pipeline (AWS ↔ GCP)

Multi-Cloud Real-time Data Pipeline (AWS ↔ GCP)

2022.12 - 2023.03

AWS DMS CDC, Lambda, SQS를 활용하여 RDS Aurora의 데이터를 Google BigQuery로 준실시간 이동하는 멀티클라우드 파이프라인 구축. 일 4,000만 건 데이터 처리로 실시간 분석 및 FDS 지원

✨ 일 4,000만 건 데이터 처리 ✨ 99.9% 데이터 정합성
AWS DMS AWS Lambda SQS Google BigQuery +2
자세히 보기
Redshift 인프라 현대화 & 멀티클러스터 아키텍처

Redshift 인프라 현대화 & 멀티클러스터 아키텍처

2024.01 - 2024.06

단일 클러스터 DW 환경을 멀티클러스터로 전환하여 성능 병목 해결. AWS와 협업하여 Games on AWS 발표 및 $34K 크레딧 확보. Concurrency Scaling, 암호화, 비용 최적화 적용

✨ AWS 크레딧 $34K 확보 ✨ Games on AWS 발표
Amazon Redshift AWS Terraform Grafana +1
자세히 보기
LLM 기반 Text-to-SQL 시스템 (MayoBot)

LLM 기반 Text-to-SQL 시스템 (MayoBot)

2024.01 - 2024.03

LangChain과 OpenAI GPT를 활용한 챗봇 형태의 Text-to-SQL 시스템 구축. 자연어 질의를 SQL로 변환하여 데이터 추출 요청을 70% 감소시키고 비개발자도 쉽게 데이터 조회 가능

✨ 데이터 추출 요청 70% 감소 ✨ 자연어 → SQL 변환
OpenAI GPT LangChain Chainlit FastAPI +1
자세히 보기
Trino 기반 DataLake 플랫폼 구축

Trino 기반 DataLake 플랫폼 구축

2023.12 - 2024.01

Trino를 AWS ECS에 배포하여 다양한 데이터 소스(S3, BigQuery, Redshift 등)를 통합 쿼리할 수 있는 DataLake 환경 구축. Federated Query와 Iceberg 테이블 포맷 활용

✨ 15개 이상 데이터 소스 통합 ✨ Federated Query 지원
Trino AWS ECS Apache Iceberg S3 +1
자세히 보기
AWS 인프라 비용 최적화 프로젝트

AWS 인프라 비용 최적화 프로젝트

2021.01 - 2024.06

S3 Intelligent Tiering, Graviton 인스턴스, Serverless 아키텍처 등을 통한 체계적인 비용 최적화. 월 $1,000+ 절감 달성 및 지속적인 비용 모니터링 체계 구축

✨ 월 $1,000+ 비용 절감 ✨ S3 Intelligent Tiering
AWS Cost Explorer S3 Lifecycle Graviton Lambda +1
자세히 보기
다양한 외부 데이터 소스 통합 플랫폼

다양한 외부 데이터 소스 통합 플랫폼

2021.01 - 2024.06

Google/Apple 마켓, Data.ai, ElasticSearch, DynamoDB, Redis 등 15개 이상의 외부 데이터 소스를 안정적으로 수집하는 통합 플랫폼 구축. API 제한 대응 및 자동 복구 시스템 포함

✨ 15개 이상 데이터 소스 ✨ API Rate Limiting 대응
Python AWS Lambda Prefect API Integration +2
자세히 보기
데이터 파이프라인 자동화 & 모니터링 시스템

데이터 파이프라인 자동화 & 모니터링 시스템

2022.01 - 2024.12

Grafana, CloudWatch, Prefect를 활용한 종합적인 모니터링 시스템 구축. 자동화를 통해 운영 리소스 90% 절감 및 장애 대응 시간 최소화

✨ 운영 리소스 90% 절감 ✨ 실시간 장애 감지
Grafana CloudWatch Prefect AWS SNS +1
자세히 보기

Technical Expertise

Cloud Platforms

AWS (Expert) Google Cloud Platform Azure

Data Engineering

Apache Spark Apache Kafka Airflow dbt Trino Prefect

Databases

Redshift BigQuery PostgreSQL MySQL DynamoDB ElasticSearch Redis

Programming

Python SQL Scala Java JavaScript

Infrastructure

Terraform Docker ECS Kubernetes Grafana Prometheus

AI/ML

LangChain OpenAI GPT MLflow Scikit-learn TensorFlow

Specialties

Real-time Data Pipeline Multi-cloud Architecture Cost Optimization Data Governance

Let's Connect

데이터 엔지니어링에 대해 이야기하고 싶으시다면 언제든 연락주세요!