GloZ 登上 AWS 官方技術部落格:Amazon OpenSearch 翻譯人才搜尋系統案例
項目

GloZ 登上 AWS 官方技術部落格:Amazon OpenSearch 翻譯人才搜尋系統案例

2026/5/18
8分鐘閱讀

AWS 官方技術部落格介紹了 GloZ 使用 Amazon OpenSearch Service 與 Amazon Bedrock 建構 hybrid search 翻譯人才媒合系統的實際案例,可支援近10萬名譯者搜尋。

發布時間:

🎯 登上 AWS 官方技術部落格

2026年5月18日,GloZ 的自然語言履歷搜尋系統案例正式刊登於AWS 官方技術部落格。這也是 AWS Korea Solutions Architects 團隊首次深入解析 GloZ 的多語 hybrid search 架構,該系統可支援近10萬名專業譯者的搜尋與媒合。

📌 為什麼要重建搜尋系統

GloZ 經營涵蓋70多種語言的全球專業譯者網路,規模接近10萬人。每一次專案媒合,都需要同時評估多項條件:

  • 語言組合(例如 KO→EN、EN→JA)
  • 領域專業性(遊戲、醫療、法律等)
  • CAT 工具熟練度(Trados、MemoQ 等)
  • 可配合時段與回應速度

過去的架構採用 PostgreSQL 搭配自建 vector DB,關鍵字搜尋與語意搜尋需要分開維運,不僅增加系統複雜度,也限制了媒合準確率。

⚙️ Solution: OpenSearch + Bedrock 整合式架構

GloZ 將搜尋基礎架構全面整合至 Amazon OpenSearch Service。核心組成包括:

  • Hybrid Search:在單一查詢中整合 BM25 關鍵字比對與 k-NN 向量搜尋(HNSW 演算法)
  • Embedding:使用 Amazon Bedrock 的 Cohere Embed v4 建立多語 embedding,並以 Claude Haiku 4.5 完成履歷摘要與中繼資料正規化
  • Nori 韓文斷詞分析:優化韓文履歷中的同義詞與複合名詞處理
  • ML Connector + Ingest Pipeline:於索引階段自動產生 embedding

📊 核心成果

  • nDCG@10 達到 0.852,接近 0.90 目標值,顯著提升前10筆結果品質
  • 支援 30+ 語言整合搜尋,可於單一索引同時媒合韓文、英文、日文、中文、西班牙文等語言
  • 整合關鍵字與語意搜尋,降低多套搜尋基礎架構的維運負擔
  • 支援 PDF、DOCX、OCR 掃描檔等多種履歷格式

💡 關鍵啟示:資料品質比模型選擇更重要

此案例最重要的洞察之一,是「資料品質比模型選擇更重要」。GloZ 優先投入履歷正規化流程,包括以 LLM 進行中繼資料擷取、同義詞映射與 hallucination 驗證,最終大幅提升搜尋準確率。

🔗 原文出處

完整技術細節可參閱AWS 官方技術部落格。透過結合 8萬+ 譯者網路與 AI 基礎架構,GloZ 正持續推動全球內容在地化的技術標準演進。