AWS publicó el caso de GloZ sobre cómo construyó un sistema de matching para casi 100,000 traductores usando Amazon OpenSearch Service y Amazon Bedrock con hybrid search multilingüe.
Publicado:
🎯 Publicación en el blog técnico oficial de AWS
El 18 de mayo de 2026, el blog técnico oficial de AWS publicó el caso de GloZ sobre la construcción de un sistema de búsqueda de currículums basado en lenguaje natural. Se trata del primer caso de estudio en el que el equipo de AWS Korea Solutions Architects analiza la arquitectura multilingüe de hybrid search de GloZ para matching de casi 100,000 traductores profesionales.
📌 Por qué GloZ reconstruyó su sistema de búsqueda
GloZ opera una red global de casi 100,000 traductores profesionales que trabajan en más de 70 idiomas. Cada asignación de proyecto requiere evaluar múltiples variables:
- Pares de idiomas (por ejemplo, KO→EN, EN→JA)
- Especialización temática (videojuegos, medicina, legal, etc.)
- Dominio de herramientas CAT (Trados, MemoQ, etc.)
- Disponibilidad horaria y velocidad de respuesta
La arquitectura anterior, basada en PostgreSQL y una vector DB propia, obligaba a operar por separado la búsqueda por palabras clave y la búsqueda semántica. Esto aumentaba la complejidad operativa y limitaba la precisión del matching.
⚙️ Solution: arquitectura unificada con OpenSearch + Bedrock
GloZ consolidó toda su infraestructura de búsqueda en Amazon OpenSearch Service. Componentes principales:
- Hybrid Search: integración de matching BM25 y búsqueda vectorial k-NN (algoritmo HNSW) en una sola consulta
- Embedding: uso de Cohere Embed v4 de Amazon Bedrock para embeddings multilingües y Claude Haiku 4.5 para resúmenes y normalización de metadatos
- Análisis morfológico coreano con Nori: optimización de sinónimos y sustantivos compuestos en currículums coreanos
- ML Connector + Ingest Pipeline: generación automática de embeddings durante la indexación
📊 Resultados clave
- nDCG@10 de 0.852, acercándose al objetivo de 0.90 para calidad de resultados top 10
- Búsqueda unificada en 30+ idiomas dentro de un único índice, incluyendo coreano, inglés, japonés, chino y español
- Eliminación de la carga operativa de mantener infraestructuras separadas para búsqueda semántica y por keywords
- Soporte para múltiples formatos de currículum: PDF, DOCX y documentos escaneados con OCR
💡 Lección principal: la calidad de los datos pesa más que el modelo
La conclusión más relevante del proyecto fue que la calidad de los datos tiene mayor impacto que la elección del modelo. GloZ priorizó la normalización de currículums mediante extracción de metadatos con LLM, mapeo de sinónimos y validación de hallucination, lo que elevó significativamente la precisión de búsqueda.
🔗 Fuente original
Todos los detalles técnicos están disponibles en el blog técnico oficial de AWS. Con su red de 80,000+ traductores y una infraestructura impulsada por IA, GloZ sigue definiendo nuevos estándares tecnológicos para la localización global de contenidos.