Un programa informático ayuda a descifrar la antigua lengua ugarítica

Un nuevo sistema desarrollado en el MIT que solo ocupó un par de horas para descifrar gran parte de la antigua lengua ugarítica podría ayudar a mejorar el software de traducción en línea.

En su libro del 2002 Idiomas Perdidos, Andrew Robinson, el editor literario de "Veces" Suplemento de educación superior de Londres, declaró que "el desciframiento arqueológico ha resultado exitoso para exigir una síntesis de la lógica y la intuición … que las computadoras no (y probablemente no) poseen."

Regina Barzilay, profesora asociada de la Computación del MIT Ciencia y del Laboratorio de Inteligencia Artificial, Ben Snyder un estudiante de posgrado en su laboratorio, y Kevin Knight’s de la Universidad de Sur de California tuvieron que reclamar personalmente. En la Reunión Anual de la Asociación de Lingüística Computacional en Suecia del próximo mes , se presentará un documento que describe un nuevo sistema informático que, en cuestión de horas, ha descifrado gran parte de la antigua lengua semítica ugarítica. Además de ayudar a los arqueólogos a descifrar ocho lenguas tan antiguas que han resistido hasta ahora a sus esfuerzos, el trabajo también podría ayudar a ampliar el número de lenguas que los sistemas de traducción automática como Google Translate pueden manejar.

Fuente: Universitam.com, 30 de junio de 2010

Para duplicar la "intuición" que según Robinson cree que eluden las computadoras, el software de los investigadores hace varios supuestos. La primera es que la lengua que es descifrada está estrechamente relacionada con algún otro idioma: En el caso del ugarítico, los investigadores eligieron hebreo. La siguiente es que hay una manera sistemática para asignar el alfabeto de un idioma en el alfabeto de la otra, y que los símbolos de correlación se producen con frecuencias similares en los dos idiomas .

El sistema parte de un supuesto similar en el plano de la palabra: Los idiomas deben tener al menos algunos cognados o palabras con raíces comunes, como principal y Mano en francés y español , o homme y hombre. Y, por último , el sistema supone una asignación similar para partes de palabras. Una palabra como "sobrecarga", por ejemplo, tiene tanto un prefijo –"sobre"– y un sufijo – “carga”. “El sistema podría anticipar que otras palabras en la lengua contará con el prefijo "sobre" o el sufijo "carga" o ambos, y que cognado de la "sobrecarga" existe en otro idioma –por ejemplo, "surchargeant" en francés– que tienen una estructura similar de tres partes.

Crosstalk

El sistema reproduce los distintos niveles de la correspondencia fuera de sí. Se podría empezar, por ejemplo, con algunas hipótesis que compiten por las asignaciones alfabéticas, basado enteramente en la frecuencia de símbolos – símbolos de mapas que se producen con frecuencia en un solo idioma que a su vez se producen con frecuencia en la otra. El uso de un tipo de modelos probabilísticos común en la investigación de inteligencia artificial , entonces sería determinar cuál de las asignaciones parece haber identificado un conjunto coherente de sufijos y prefijos. Sobre esa base, podría buscar las correspondencias en el plano de la palabra, y los que, a su vez, podría ayudar a refinar su mapeo alfabético. "Tenemos que recorrer los cientos de datos, miles de veces", dice Snyder, "y cada vez, nuestras conjeturas tienen mayor probabilidad, porque en realidad estamos acercandonos a una solución con la que conseguimos más coherencia". Finalmente, el sistema llega a un punto en el que alterar sus asignaciones ya no mejora la consistencia.

El Ugarítico ya ha sido descifrado: De lo contrario, los investigadores no habrían tenido forma de medir el rendimiento de su sistema. El alfabeto ugarítico consta de 30 letras, y el sistema ha asignado correctamente 29 de ellas a sus homólogo hebreo. Aproximadamente un tercio de las palabras en hebreo tienen cognados ugaríticos, y de ellos, el sistema correctamente identificó el 60 por ciento. "De los que son incorrectos, a menudo son correctos sólo por una sola letra, por lo que son a menudo muy buenas conjeturas", dice Snyder.

Por otra parte, señala, el sistema no utiliza actualmente toda la información de contexto para resolver ambigüedades. Por ejemplo, las palabras ugarítica de "casa" e "hija" se escriben de la misma manera, pero sus contrapartes hebreas no lo hacen. Aunque el sistema de vez en cuando puede mezclarlos, un descifrador humano podría fácilmente decir que contexto se pretendía.

Babel

Sin embargo, Andrew Robinson sigue siendo escéptico. "Si los autores consideran que su enfoque conducirá finalmente a un informatizado "automático" del desciframiento de escrituras sin descifrar en la actualidad", escribe en un e- mail "entonces me temo que no estoy del todo convencido por su periódico". Los investigadores, dice, suponen que el idioma que se ha descifrado su alfabeto se puede incorporar a el alfabeto de un idioma conocido –"que es casi seguro que no ocurre con ninguna de las lenguas importantes que aún siguen sin descifrar las secuencias de comandos", escribe Robinson . También se supone, argumenta, que está claro de dónde termina un carácter o palabra y empieza otra , que no es el caso de muchos descifrados y sin descifrar secuencias de comandos.

“Cada idioma tiene sus propios desafíos", Barzilay está de acuerdo. "Lo más probable, es que un desciframiento éxitoso requiere adaptar el método a las peculiaridades de una lengua". Pero, el desciframiento del Ugaritico llevó años y se basó en algunas coincidencias felices –tales como el descubrimiento de un hacha que tenía la palabra "hacha" escrita en ella en el ugarítico. "La salida de nuestro sistema habría hecho el proceso de órdenes de magnitud más corta", dice.

De hecho, Snyder y Barzilay no creen que un sistema como el que diseñaron con Knight nunca sustituirá a descifradores humanos. "Pero es una poderosa herramienta que puede ayudar al proceso de desciframiento humano", dice Barzilay . Por otra parte, una variación del sistema también podría ayudar a ampliar la versatilidad de un software de traducción. Muchos traductores en línea se basan en el análisis de textos paralelos para determinar las correspondencias de las palabras: Podrían, por ejemplo, pasar por las obras completas de Voltaire , Balzac , Proust y un anfitrión de otros escritores, tanto en Inglés y Francés , en busca de coherencia entre las asignaciones de las palabras. "Esa es la manera en que los sistemas estadísticos de traducción han trabajado durante los últimos 25 años", dice Caballero.

Pero no todas las lenguas tienen tales literaturas exhaustiva traducidas : En la actualidad , señala Snyder, Google Translate tiene obras de sólo 57 idiomas . Las técnicas utilizadas en el sistema de desciframiento podrían adaptarse para ayudar a construir léxicos para miles de otros idiomas. "La tecnología es muy similar", dice Caballero , quien trabaja en la traducción automática . "Ellos se alimentan mutuamente".

Visitas: 1005

Comentario por Guillermo Caso de los Cobos el julio 10, 2010 a las 4:15pm
El sistema de traducción informático de la lengua ugarítica que aquí nos describen no cabe duda que ayudará a descifrar la misma, si bien, como anotan los investigadores Snyder y Barzilay, el concurso humano se presenta todavía imprescindible para su desciframiento, máxime en su elaboración contextual.

Un ejemplo de tal dificultad lo tenemos en el ejemplo que proporciona la noticia que reproducimos más abajo, en la cual se describe que un musicólogo sirio ha sido capaz de transcribir la música que viene escrita en una tablilla cuneiforme también de la ciudad de Ugarit.

Es evidente que, por muy avanzado que fuera el programa informático de referencia, en este caso habría fracasado rotundamente.


Un investigador sirio compone música a partir de una tableta cuneiforme de Ugarit

Vía: Global Arabe Network | Sabbagh H. | 08 de julio de 2010

Siria (Lattakia) - El musicólogo Ziad Ajjan ha compuesto poemas y piezas musicales a partir de una tableta cuneiforme conocida como "Himno de la Súplica" H6, descubierta en Ugarit el pasado siglo.

Ajjan compuso tres piezas musicales basadas en las notas de música que aparecen en dicha tableta que data de 1400 a. C., cuyos nombres son "Salida del sol", "Puesta de sol ", y "Vacaciones en Ugarit".

Se trata de la grabación de música registrada más antigua del mundo.

Ajjan dijo que todavía está trabajando en la tableta, basándose en la información que llegó después de mucho estudio y experimentos anteriores, y haciendo uso de la investigación llevada a cabo por sus compañeros de estudios, los sirios Mohammad Ahmad Soso y Kurkmaz Sajii, y el análisis de las frases del texto de la tableta.

La tableta contiene un himno completo, tanto en letra como en música, además de las instrucciones detalladas para sea ajecutado por un cantante acompañado de un arpista, así como las instrucciones sobre cómo ajustar el arpa.

Esta tableta de arcilla es una de varias que fueron excavados en la década de 1950 en la antigua ciudad siria de Ugarit, lo que hoy es Ras Shamra, a 12 kilómetros al norte de la ciudad de Latakia, en la costa de Siria, alrededor de 260 kilómetros al norte de Damasco .

Ugarit fue una antigua ciudad cosmopolita, con un puerto construido alrededor de 6000 a. C., alcanzando una gran prosperidad desde 1450 a. C. hasta 1200 a. C., cuando fue abandonado.

El primer alfabeto escrito, el alfabeto ugarítico, fue inventado alrededor de 1400 a. C. Se componía de 30 letras cuneiformes y comparte similitudes con la lengua árabe en términos de significados y gramática.

A principios de junio, la cantante siria Omran Noma, soprano, interpretó una melodía de la tableta en el templo budista-zen, Daitoku-ji, en Kyoto, acompañada por los monjes del templo y el percusionista japonés Yamashta Stomu. (SANA)

Comentar

¡Necesitas ser un miembro de Arqueologia, Historia Antigua y Medieval - Terrae Antiqvae para añadir comentarios!

Participar en Arqueologia, Historia Antigua y Medieval - Terrae Antiqvae

TRANSLATE BY GOOGLE

Busca en Terrae Antiqvae

Recibe en tu correo los últimos artículos publicados en Terrae Antiqvae -Boletín Gratuito-

Enter your email:

Courtesy of FeedBurner

 

Donaciones

Terrae Antiqvae es una Red Social sin ánimo de lucro. Necesitamos tu apoyo para el mantenimiento del sitio. Apadrina esta Comunidad 

¡Gracias por tu ayuda!

Contacto con el editor:

Publicidad by Google

 

Lo más visto

Patrocinador: SMO Sistemas

Nuestro Canal de Vídeos en YouTube. ¡Suscríbete!

Síguenos en Redes Sociales: Facebook y Twitter

¡Gracias por visitarnos! ¡Bienvenid@!

Estadísticas desde 12 de noviembre de 2014.

Derechos de Autor:
Licencia de Creative Commons
Terrae Antiqvae® is licensed under a Creative Commons Reconocimiento-NoComercial-SinObraDerivada 3.0 Unported License.

Información legal: Terrae Antiqvae® es Marca registrada por José Luis Santos Fernández. Marca nº 2.679.154 - Clase 41, Madrid, España. Reservados todos los Derechos. En Internet desde Julio de 2001.

Normas de la Comunidad (Aviso Legal):  Netiqueta - Términos de servicio

© 2024   Creado por José Luis Santos Fernández.   Tecnología de

Emblemas  |  Reportar un problema  |  Términos de servicio

Usamos cookies propias y de terceros que entre otras cosas recogen datos sobre sus hábitos de navegación para mostrarle publicidad personalizada y realizar análisis de uso de nuestro sitio. Si continúa navegando consideramos que acepta su uso. OK Más información | Y más