AWS DMS CDC, Lambda, SQS를 활용하여 RDS Aurora의 데이터를 Google Bigquery로 준실시간으로 이동하는 데이터 파이프라인 구축
Trino를 AWS ECS에 배포하여 사용자들이 다양한 데이터 소스를 확인할 수 있고 DataLake 형태로 데이터를 사용할 수 있게 확장함
Chainlit과 LangChain(LangServe)를 활용하여 챗봇형태의 Text To SQL을 구축하여 데이터 추출 요청을 줄이고 사용자들이 쉽게 데이터를 추출할 수 있게 함
SaaS, Snapshot, Query, CDC 등 다양한 형태의 ETL을 구축해가며 상황에 맞는 ETL을 선택하고, 이를 통해 Source DB에 영향없이 효과적으로 데이터를 추출하여 DW에 적재하는 경험을 쌓음
AWS Cloud상에서 IaC(Terraform), DW(Redshift/Bigquery) Monitoring, Grafana를 통한 인프라 모니터링 및 알람, Cost Optimization, 공용라이브러리 등 다양한 인프라 관리 경험을 쌓음
다양한 데이터 소스(ElasticSearch, DynamoDB, Timeseries(prometheus, influx), redis, 구글/애플마켓, data.ai 등)로부터 데이터 파이프라인을 구축하여 데이터 분석의 확장을 지원함
마케팅 비용 관리 사이트, AI 배치(어뷰저탐지, 고객이탈, 첫구매예측) 등의 기능을 개발하고 운영함