GloZがAmazon OpenSearch ServiceとAmazon Bedrockを活用し、約10万人の翻訳者をhybrid searchでマッチングする検索基盤を構築した事例が、AWS公式技術ブログで紹介されました。
公開日:
🎯 AWS公式技術ブログに掲載
2026年5月18日、GloZによる自然言語ベースの翻訳者レジュメ検索システム構築事例が、AWS公式技術ブログで公開されました。AWS Korea Solutions Architects チームが、約10万人規模の翻訳者ネットワークを多言語hybrid searchでマッチングするGloZのアーキテクチャを分析した初のケーススタディです。
📌 検索システムを刷新した理由
GloZは、70以上の言語で活動する約10万人の専門翻訳者ネットワークを運営しています。案件ごとのマッチングでは、さまざまな条件を同時に考慮する必要があります。
- 言語ペア(例:KO→EN、EN→JA)
- 専門分野(ゲーム、医療、法務など)
- CATツール習熟度(Trados、MemoQなど)
- 対応可能時間帯とレスポンス速度
従来はPostgreSQLと独自vector DBを組み合わせて運用していましたが、キーワード検索と意味検索を別々に管理する必要があり、検索精度と運用効率の両面で課題がありました。
⚙️ Solution: OpenSearch + Bedrock統合アーキテクチャ
GloZは検索基盤をAmazon OpenSearch Serviceへ統合しました。主な構成要素は以下の通りです。
- Hybrid Search:BM25によるキーワード検索とk-NNベクトル検索(HNSWアルゴリズム)を単一クエリで統合
- Embedding:Amazon BedrockのCohere Embed v4(多言語Embedding)とClaude Haiku 4.5(レジュメ要約・メタデータ正規化)
- Nori韓国語形態素解析:韓国語レジュメにおける同義語や複合名詞を最適化
- ML Connector + Ingest Pipeline:インデックス時にEmbeddingを自動生成
📊 主な成果
- nDCG@10 0.852を達成(上位10件の検索品質指標として目標値0.90に近接)
- 30+言語を単一インデックスで横断検索。韓国語・英語・日本語・中国語・スペイン語などを同時にマッチング
- キーワード検索と意味検索を統合し、別個の検索基盤運用を不要化
- PDF、DOCX、OCR処理したスキャン画像など、多様なレジュメ形式に対応
💡 最大の学び:重要なのはモデル選定よりデータ品質
この事例で特に重要だったのは、「モデル選定以上にデータ品質が重要」という点です。GloZはLLMによるメタデータ抽出、同義語マッピング、hallucination検証を通じてレジュメ正規化を徹底し、それが検索精度向上の決定打となりました。
🔗 原文はこちら
技術的な詳細については、AWS公式技術ブログをご覧ください。GloZは、8万+翻訳者ネットワークとAIインフラを融合し、グローバルコンテンツローカライズの新たな技術基準づくりを進めています。