AWS 공식 기술 블로그 게재 — GloZ의 자연어 이력서 검색 시스템 구축 사례
프로젝트

AWS 공식 기술 블로그 게재 — GloZ의 자연어 이력서 검색 시스템 구축 사례

2026. 5. 18.
8분 읽기

GloZ가 Amazon OpenSearch Service와 Amazon Bedrock으로 약 10만 명 번역가 풀을 hybrid search로 매칭하는 검색 시스템을 구축한 사례가 AWS 공식 기술 블로그에 게재됐습니다.

게시일:

🎯 AWS 공식 기술 블로그 등재

2026년 5월 18일, GloZ의 자연어 이력서 검색 시스템 구축 사례가 AWS 공식 기술 블로그에 게재되었습니다. AWS Korea Solutions Architects 팀이 약 10만 명 전문 번역가 풀을 다국어 hybrid search로 매칭하는 GloZ의 아키텍처를 분석한 첫 번째 케이스 스터디입니다.

📌 왜 검색 시스템을 재구축했나

GloZ는 약 10만 명의 전문 번역가가 70개 이상 언어에서 활동하는 글로벌 네트워크를 운영합니다. 단 한 번의 프로젝트 매칭에서도 고려해야 할 조건은 다층적입니다:

  • 언어 쌍 (예: KO→EN, EN→JA)
  • 도메인 전문성 (게임, 의료, 법률 등)
  • CAT 도구 숙련도 (Trados, MemoQ 등)
  • 가용 시간대 + 응답 속도

기존 PostgreSQL과 자체 vector DB 조합은 키워드 검색과 의미 검색을 별도로 운영해야 했고, 매칭 정확도와 운영 복잡도 양쪽 모두에 한계가 있었습니다.

⚙️ Solution: OpenSearch + Bedrock 통합 아키텍처

GloZ는 검색 인프라를 Amazon OpenSearch Service로 일원화했습니다. 핵심 구성 요소:

  • Hybrid Search: BM25 키워드 매칭 + k-NN 벡터 검색(HNSW 알고리즘)을 단일 쿼리에 결합
  • Embedding: Amazon Bedrock의 Cohere Embed v4(다국어 임베딩)와 Claude Haiku 4.5(이력서 요약·메타데이터 정규화)
  • Nori 한국어 형태소 분석: 한국어 이력서의 동의어·복합 명사 처리
  • ML Connector + Ingest Pipeline: 인덱싱 시점에 임베딩 자동 생성

📊 핵심 성과

  • nDCG@10 0.852 달성 (목표 0.90에 근접 — 상위 10개 결과의 품질 지표)
  • 30+ 언어 통합 검색 — 단일 인덱스에서 한국어·영어·일본어·중국어·스페인어 등 동시 매칭
  • 키워드와 의미 검색을 통합하여 별도 인프라 운영 부담 제거
  • PDF, DOCX, 스캔 이미지(OCR) 등 다양한 이력서 포맷 처리

💡 핵심 교훈: 데이터 품질 > 모델 선택

사례의 가장 중요한 인사이트는 "모델 선택보다 데이터 품질이 더 중요"라는 점입니다. GloZ는 LLM 기반 메타데이터 추출, 동의어 매핑, hallucination 검증 단계를 거쳐 이력서 정규화를 우선했고, 이것이 검색 정확도를 결정적으로 끌어올렸습니다.

🔗 원문 출처

전체 기술 디테일은 AWS 공식 기술 블로그에서 확인하실 수 있습니다. GloZ는 8만+ 번역가 네트워크와 AI 인프라 결합 사례로 글로벌 콘텐츠 현지화의 기술 표준을 만들어가고 있습니다.