AWS公式技術ブログ掲載 — GloZのAmazon OpenSearch翻訳者検索システム事例
プロジェクト後日談

AWS公式技術ブログ掲載 — GloZのAmazon OpenSearch翻訳者検索システム事例

2026/5/18
8分で読了

GloZがAmazon OpenSearch ServiceとAmazon Bedrockを活用し、約10万人の翻訳者をhybrid searchでマッチングする検索基盤を構築した事例が、AWS公式技術ブログで紹介されました。

公開日:

🎯 AWS公式技術ブログに掲載

2026年5月18日、GloZによる自然言語ベースの翻訳者レジュメ検索システム構築事例が、AWS公式技術ブログで公開されました。AWS Korea Solutions Architects チームが、約10万人規模の翻訳者ネットワークを多言語hybrid searchでマッチングするGloZのアーキテクチャを分析した初のケーススタディです。

📌 検索システムを刷新した理由

GloZは、70以上の言語で活動する約10万人の専門翻訳者ネットワークを運営しています。案件ごとのマッチングでは、さまざまな条件を同時に考慮する必要があります。

  • 言語ペア(例:KO→EN、EN→JA)
  • 専門分野(ゲーム、医療、法務など)
  • CATツール習熟度(Trados、MemoQなど)
  • 対応可能時間帯とレスポンス速度

従来はPostgreSQLと独自vector DBを組み合わせて運用していましたが、キーワード検索と意味検索を別々に管理する必要があり、検索精度と運用効率の両面で課題がありました。

⚙️ Solution: OpenSearch + Bedrock統合アーキテクチャ

GloZは検索基盤をAmazon OpenSearch Serviceへ統合しました。主な構成要素は以下の通りです。

  • Hybrid Search:BM25によるキーワード検索とk-NNベクトル検索(HNSWアルゴリズム)を単一クエリで統合
  • Embedding:Amazon BedrockのCohere Embed v4(多言語Embedding)とClaude Haiku 4.5(レジュメ要約・メタデータ正規化)
  • Nori韓国語形態素解析:韓国語レジュメにおける同義語や複合名詞を最適化
  • ML Connector + Ingest Pipeline:インデックス時にEmbeddingを自動生成

📊 主な成果

  • nDCG@10 0.852を達成(上位10件の検索品質指標として目標値0.90に近接)
  • 30+言語を単一インデックスで横断検索。韓国語・英語・日本語・中国語・スペイン語などを同時にマッチング
  • キーワード検索と意味検索を統合し、別個の検索基盤運用を不要化
  • PDF、DOCX、OCR処理したスキャン画像など、多様なレジュメ形式に対応

💡 最大の学び:重要なのはモデル選定よりデータ品質

この事例で特に重要だったのは、「モデル選定以上にデータ品質が重要」という点です。GloZはLLMによるメタデータ抽出、同義語マッピング、hallucination検証を通じてレジュメ正規化を徹底し、それが検索精度向上の決定打となりました。

🔗 原文はこちら

技術的な詳細については、AWS公式技術ブログをご覧ください。GloZは、8万+翻訳者ネットワークとAIインフラを融合し、グローバルコンテンツローカライズの新たな技術基準づくりを進めています。