Regresar

Tachiwin gana el ERNIE AI Developer Challenge

Tachiwin gana el ERNIE AI Developer Challenge

Tachiwin ha ganado este hackathon con su modelo TachiwinOCR que fortalecerá la capacidad de digitalización de textos en lengua originarias. El modelo fue diseñado específicamente para manejar las particularidades de las lenguas indígenas de México.

El proyecto aborda un desafío crítico: la falta de recursos digitales para las 68 lenguas originarias de México, lo que dificulta la creación de modelos de lenguaje (LLMs) modernos. Mediante el uso de un conjunto de datos sintético de 50,000 imágenes que cubren la vasta diversidad lingüística del país, el equipo logró ajustar el modelo PaddleOCR-VL, optimizando su capacidad para reconocer caracteres latinos no estándar y glifos específicos que son comunes en estas lenguas.

A pesar de contar con recursos limitados y de ser una iniciativa sin fines de lucro, TachiwinOCR logró reducir la tasa de error en un 10%, demostrando la viabilidad de soluciones de vanguardia en entornos de bajos recursos. Este reconocimiento es solo el comienzo, ya que el equipo planea expandir las capacidades del modelo hacia la clasificación de textos, la generación de contenido y la traducción automática, fortaleciendo así los derechos lingüísticos y el acceso tecnológico para las comunidades originarias.

Visita el proyecto en Devpost