GloZ가 Amazon OpenSearch Service와 Amazon Bedrock으로 약 10만 명 번역가 풀을 hybrid search로 매칭하는 검색 시스템을 구축한 사례가 AWS 공식 기술 블로그에 게재됐습니다.
게시일:
🎯 AWS 공식 기술 블로그 등재
2026년 5월 18일, GloZ의 자연어 이력서 검색 시스템 구축 사례가 AWS 공식 기술 블로그에 게재되었습니다. AWS Korea Solutions Architects 팀이 약 10만 명 전문 번역가 풀을 다국어 hybrid search로 매칭하는 GloZ의 아키텍처를 분석한 첫 번째 케이스 스터디입니다.
📌 왜 검색 시스템을 재구축했나
GloZ는 약 10만 명의 전문 번역가가 70개 이상 언어에서 활동하는 글로벌 네트워크를 운영합니다. 단 한 번의 프로젝트 매칭에서도 고려해야 할 조건은 다층적입니다:
- 언어 쌍 (예: KO→EN, EN→JA)
- 도메인 전문성 (게임, 의료, 법률 등)
- CAT 도구 숙련도 (Trados, MemoQ 등)
- 가용 시간대 + 응답 속도
기존 PostgreSQL과 자체 vector DB 조합은 키워드 검색과 의미 검색을 별도로 운영해야 했고, 매칭 정확도와 운영 복잡도 양쪽 모두에 한계가 있었습니다.
⚙️ Solution: OpenSearch + Bedrock 통합 아키텍처
GloZ는 검색 인프라를 Amazon OpenSearch Service로 일원화했습니다. 핵심 구성 요소:
- Hybrid Search: BM25 키워드 매칭 + k-NN 벡터 검색(HNSW 알고리즘)을 단일 쿼리에 결합
- Embedding: Amazon Bedrock의 Cohere Embed v4(다국어 임베딩)와 Claude Haiku 4.5(이력서 요약·메타데이터 정규화)
- Nori 한국어 형태소 분석: 한국어 이력서의 동의어·복합 명사 처리
- ML Connector + Ingest Pipeline: 인덱싱 시점에 임베딩 자동 생성
📊 핵심 성과
- nDCG@10 0.852 달성 (목표 0.90에 근접 — 상위 10개 결과의 품질 지표)
- 30+ 언어 통합 검색 — 단일 인덱스에서 한국어·영어·일본어·중국어·스페인어 등 동시 매칭
- 키워드와 의미 검색을 통합하여 별도 인프라 운영 부담 제거
- PDF, DOCX, 스캔 이미지(OCR) 등 다양한 이력서 포맷 처리
💡 핵심 교훈: 데이터 품질 > 모델 선택
사례의 가장 중요한 인사이트는 "모델 선택보다 데이터 품질이 더 중요"라는 점입니다. GloZ는 LLM 기반 메타데이터 추출, 동의어 매핑, hallucination 검증 단계를 거쳐 이력서 정규화를 우선했고, 이것이 검색 정확도를 결정적으로 끌어올렸습니다.
🔗 원문 출처
전체 기술 디테일은 AWS 공식 기술 블로그에서 확인하실 수 있습니다. GloZ는 8만+ 번역가 네트워크와 AI 인프라 결합 사례로 글로벌 콘텐츠 현지화의 기술 표준을 만들어가고 있습니다.