Name: GloZ Inc. ソウルオフィス
Price range: $$

公開日: 2026年5月

🎯 AWS公式技術ブログに掲載

2026年5月18日、GloZによる自然言語ベースの翻訳者レジュメ検索システム構築事例が、AWS公式技術ブログで公開されました。AWS Korea Solutions Architects チームが、約10万人規模の翻訳者ネットワークを多言語hybrid searchでマッチングするGloZのアーキテクチャを分析した初のケーススタディです。

📌 検索システムを刷新した理由

GloZは、70以上の言語で活動する約10万人の専門翻訳者ネットワークを運営しています。案件ごとのマッチングでは、さまざまな条件を同時に考慮する必要があります。

言語ペア（例：KO→EN、EN→JA）
専門分野（ゲーム、医療、法務など）
CATツール習熟度（Trados、MemoQなど）
対応可能時間帯とレスポンス速度

従来はPostgreSQLと独自vector DBを組み合わせて運用していましたが、キーワード検索と意味検索を別々に管理する必要があり、検索精度と運用効率の両面で課題がありました。

⚙️ Solution: OpenSearch + Bedrock統合アーキテクチャ

GloZは検索基盤をAmazon OpenSearch Serviceへ統合しました。主な構成要素は以下の通りです。

Hybrid Search：BM25によるキーワード検索とk-NNベクトル検索（HNSWアルゴリズム）を単一クエリで統合
Embedding：Amazon BedrockのCohere Embed v4（多言語Embedding）とClaude Haiku 4.5（レジュメ要約・メタデータ正規化）
Nori韓国語形態素解析：韓国語レジュメにおける同義語や複合名詞を最適化
ML Connector + Ingest Pipeline：インデックス時にEmbeddingを自動生成

📊 主な成果

nDCG@10 0.852を達成（上位10件の検索品質指標として目標値0.90に近接）
30+言語を単一インデックスで横断検索。韓国語・英語・日本語・中国語・スペイン語などを同時にマッチング
キーワード検索と意味検索を統合し、別個の検索基盤運用を不要化
PDF、DOCX、OCR処理したスキャン画像など、多様なレジュメ形式に対応

💡 最大の学び：重要なのはモデル選定よりデータ品質

この事例で特に重要だったのは、「モデル選定以上にデータ品質が重要」という点です。GloZはLLMによるメタデータ抽出、同義語マッピング、hallucination検証を通じてレジュメ正規化を徹底し、それが検索精度向上の決定打となりました。

🔗 原文はこちら

技術的な詳細については、AWS公式技術ブログをご覧ください。GloZは、8万+翻訳者ネットワークとAIインフラを融合し、グローバルコンテンツローカライズの新たな技術基準づくりを進めています。

AWS公式技術ブログ掲載 — GloZのAmazon OpenSearch翻訳者検索システム事例