Chinuxsoft

martes, 25 de noviembre de 2008

Sistema vocabulario ch'ol con interfaz de voz, visión cientifica...

Virgilio Rosendo Pérez Pérez ¹, Pedro I. Rosas Barreras ²
Centro de Investigación y Desarrollo de Tecnología Digital del Instituto Politécnico Nacional (CITEDI-IPN), Tijuana Baja California
perez@citedi.mx, prosasbar@hotmail.com

ResumenEn este artículo se aborda el desarrollo de una herramienta multimedia de aprendizaje, basado en la interacción hombre-máquina. A partir de la necesidad de impulsar estrategias de preservación de las lenguas maternas indígenas propias de regiones importantes de nuestro país, como la lengua ch’ol, se puede hacer uso de las tecnologías de la información y las comunicaciones para facilitar la traducción directa al español. Por ello, este desarrollo constituye una herramienta de apoyo didáctico computarizado que ayuda a conocer y aprender el idioma español y la lengua ch’ol, todo ello manejando una interfaz audiovisual y amigable entre el usuario y la computadora.

Palabras claves—Sistema Traductor, Interacción multimedia, estrategias para la preservación de las lenguas indígenas, Sistema traductor de la lengua indígena ch’ol-español, interacción hombre-maquina, enseñanza multilingüe.


I. Introducción

Los procesos virtuales de enseñanza y aprendizaje, son capaces de guiar la tecnología de la información hacia la sociedad moderna, los grandes procesos de construcción de sistemas informáticos son cada vez más complicados, ya que los usuarios tienen mayor conocimiento y se involucran mucho más con herramientas tecnológicas.

Los sistemas de información son los medios más importantes para la sociedad, en el entorno Mundial, “particularmente la Globalización y la irrupción de las Nuevas Tecnologías de la Comunicación y la información construyen nuevos entornos laborales y formativos, los cuales están sentando las bases para la constitución de la Sociedad del Mundo Informatico.

La principal cualidad del sistema es la interdependencia de las entidades que lo integran y del orden que subyace para la transformación en la información. El sistema de información es una tarea complicada que trata de automatizar las tareas complejas de múltiples procesos, poniendo de manifiesto la documentación como el resultado de la automatización.

En este artículo presentamos los resultados de este trabajo de investigación, el cual consiste en el desarrollo de una herramienta de software para el aprendizaje interactivo multimedia.

Esta publicación esta basado en la tesis del Ingeniero Virgilio Rosendo Pérez Pérez ¹ que fue presentado en la Universidad Autónoma Indígena de México, http://www.uaim.edu.mx/, en día 15 de abril del 2008, para obtener el grado de Ingeniero en Sistemas Computacionales, bajo la dirección de MSIA, Pedro I. Rosas Barreras ² Jefe de departamento de sistemas en la Universidad de Occidente www.udo.mx/

El sistema permite ayudar a las personas a enriquecer su conocimiento a través de la computadora como medio auxiliar del aprendizaje.

I. Digitalización y desarrollo de Sistema de Información Traductor de Lengua

La revolución informática ha establecido los medios electrónicos para acceder en forma ilimitada a la información. Las nuevas tecnologías en la actualidad son un medio necesario para la sociedad, ya que en ello predomina la necesidad de comunicarnos. La sociedad de la información ha provocado una brecha entre aquellos todavía reducidos grupos sociales que carecen plena o parcialmente de los beneficios de la revolución científico-técnica, y que se ven relegados al analfabetismo tecnológico, es decir, existen cuellos de botella en los saberes dentro de la sociedad, lo que impide el conocimiento de las nuevas tecnologías.

A. La digitalización y automatización del vocabulario

La automatización de diferentes documentos en cualquier formato, es la base para emprender la digitalización. Además es el reconocimiento de la tecnología lo que nos ofrece nuevas paradigmas de la lengua materna. La digitalización es la traducción de información, tal como textos, imágenes o sonidos, a un formato que puedan entender los microprocesadores, donde éstos últimos sólo son capaces de manejar los valores lógicos binarios de unos y ceros. La digitalización para la sociedad es una forma de transmisión del conocimiento de forma digital, hoy se puede hacer esto sin salir de la casa, ya que varias bibliotecas en el mundo están digitalizando sus libros para que se les pueda consultar a través de los “diversos medios tecnológicos buscando el aprendizaje autónomo y una formación humanista, crítica y creativa” [1].

En el proceso de automatización del Sistema Vocabulario Ch’ol con Interfaz de Voz, se utilizan una serie de herramientas para sus traducciones desde un procesador de textos, diccionarios, glosarios terminológicos, memorias de traducción, libros de textos, tesis, corrector ortográfico, etc.

A. Otros aspectos del sistema traductor

En México existen varias lenguas indígenas que enriquecen a nuestro país, cada día estas lenguas se están perdiendo lastimosamente [2]. Cada día están tomado auge en la sociedad los nuevos requerimientos informáticos, como herramienta esenciales.

B. Metodología de desarrollo

El desarrollo del software “Sistema Vocabulario Ch’ol con Interfaz de Voz, se realizó bajo la filosofía de programación orientado a objetos (OOP), en lengua Visual Basic Express Edition, en el cual se utilizaron varios métodos para la implementación del mismo. Para el diseño de la base de datos se utilizó el servidor SQL Servers Express Edition, permitiendo el almacenamiento de palabras, en español-ch’ol, denominada como una base de datos relacionales.

A. Desarrollo del sistema de información traductor de la lengua

La preocupación inicial sobre la definición de la estructura y calidad del código final es que se dedica cada vez más tiempo, atención y esfuerzo al diseño y modelado del sistema. “Los modelos proporcionan un mayor nivel de abstracción, permitiendo trabajar con sistemas mayores y más complejos, y facilitando el proceso de codificación e implementación del sistema de forma distribuida y en distintas plataformas” [3]. En la actualidad el lenguaje de programación es una herramienta que permite el desarrollo de interfaces tremendamente robustas. “La elección de un lenguaje de programación depende de los conocimientos del lenguaje y del ámbito o dominio de la aplicación que se está generando. Las aplicaciones de pequeño tamaño se suelen crear utilizando un único lenguaje, y es frecuente implementar aplicaciones grandes utilizando varios lenguajes [4].

El análisis de requerimientos de sistemas se divide en dos niveles: El primer nivel consiste en documentar claramente lo que el cliente requiera (Análisis de Requerimiento de Usuario). El segundo nivel es el requerimiento del desarrollador (Análisis de Requerimiento de Sistemas). “Ambos requieren de Documentos de Requisitos de Usuario (DRU) y Documento de Requisitos de Software (DRS)” [5].

Generalmente, el término sistema debe de ser innovador, robusto, capaz de satisfacer la necesidad de automatización, para que los usuarios queden satisfechos, contemplando para ello una interacción aplicada a través de una manipulación directa y por menús, lo cual es preferible a la utilización de un leguaje de orden. El usuario experimentado tiene la capacidad de explorar el sistema por medio de capas y formularios, considerando la plataforma de diseño como prioritario para entregar el software con buena calidad. En el rendimiento a mostrar se deben de considerar las siguientes características:

· Gestión de consulta de palabras

· Gestión de sintonización de sonidos

· Panel de área de práctica

· Impresión de palabras

· Acceso al sistema

El Lenguaje de Modelado Unificado (UML) es la clave principal para el diseño de software. El modelo de objetos nos permite construir y documentar el sistema vocabulario ch’ol. Durante la obtención de requerimientos y análisis obtenemos un diagrama de casos de uso. [6], el cual define los casos de uso como “una función proporcionada por el sistema que genera un resultado visible para un actor”,

Los casos de uso estudian la información capturada previamente para detectar inconsistencias, ambigüedades, duplicidad o escasez de información, etcétera, analizando las prioridades establecidas por el usuario y se asocian los requisitos relacionados entre sí para sus funcionalidades o comportamientos comunes. Reestructurando la información de los casos de uso a través de las generalizaciones y relaciones entre sesiones de trabajo con los usuarios, se contrastan las conclusiones del análisis de la información recogida. El principio básico de la interfaz suele estar diseñado alrededor de las necesidades del usuario hasta después de que el sistema haya sido completado, atendiéndose de esta manera las restricciones impuestas por el mismo, generando una serie de modelamientos visuales e algoritmos que ayudan a entender de una mejor manera el sistema, véase la figura 1.

A. Análisis y diseño de la base de datos

Una base de datos puede definirse “como uno o más archivos en los que se almacenan los archivos y toda la información que describe su estructura, fundamental para poder operar sobre ello”, [8]. La base de datos y sus diferentes tecnologías tienen una mayor utilidad en la actualidad, el desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos tienen formato electrónico, que ofrece un amplio rango de soluciones al problema de almacenar datos.

Desde el punto de vista del usuario, e incluso del administrador de la base de datos del sistema traductor, no hay diferencia alguna en el funcionamiento de los motores de almacenamiento. El sistema realizará una búsqueda detallada en la base de datos hasta encontrar la palabra buscada, así el sistema mostrará los resultados. El SGDB (Sistema de Gestión de Base de Datos) [9], en el cual distinguiremos tres clases de aspectos que deben especificarse.

· Estrategia de Almacenamiento: Este apartado para la Base de Datos del Sistema, incluye la asignación de espacios de almacenamiento para el conjunto de datos. También deberá indicarse la estrategia de localización de los datos para optimizar el tiempo de respuesta y el espacio de memoria de datos.

· Rutas de acceso: En las rutas de acceso se encuentran los datos almacenados. Se cuenta con una dirección para mejorar la búsqueda, la especificación de las palabras claves y así como los índices que incluye el sistema de vocabulario.

· Esquemas internos: Incorpora diferentes esquemas tales como una técnica de compresión de datos (Administrador).

Para conectar el sistema de aplicación con el origen de los datos (típicamente un servidor de bases de datos) se utiliza un ejemplar (objeto) de la clase Connection, también se emplean ejemplares de la clase Command que permitirá enviar comandos hacia el servidor para que este los ejecute, es decir se usan clases específicas para cada origen de datos con los se desea interactuar. La figura 2 muestra el modelado de sistema traductor que conforma dos carpetas con asociación hacia el gestor de consultas, a la cual está conectada la base de datos, esta conexión se realizó por medio de código, por lo cual no aparece ningún atributo en la tabla 1.

Fig. 2. Conexión de carpetas independientes junto con la base de datos

Demostramos en la tabla 1 la descripción de la tabla principal del sistema traductor, es decir los atributos. Dicha tabla es nombrado TBLENTPAL.

Tabla 1

Descripción de atributos de la TBLENTPAL

Nombre de la tabla

Descripción de la tabla

ID

Identificación autonumérico de las palabras

PALENTCHL

Palabras en Ch’ol

PALENTESP

Palabras en Español

DEFPALESP

Definición en Español

DEFPALCHL

Definición en Ch’ol

Una vez terminadas todas las conexiones de la base de datos ahora se procede a crear la base de datos del Sistema Vocabulario Ch’ol con el SQL Server 2005 Express, en la cual se utiliza una herramienta llamada Microsoft SQL Servers Management Studio Express como un Sistema de Gestión de Base de Datos. Esta herramienta permite ejecutar comandos "scripts" para crear una tabla y asignarle algunos datos, la base de datos llamado BDCHOL, y la tabla llamada TBLENTPAL en conjunto con sus atributos llamadas PALENTCHL, PALENTESP, DEFPALESP, DEFPALCHL y un ID autonumérico. Esto creará la tabla y añadirá los datos, se usarán dos ficheros con el código de T-SQL (Transact SQL) necesario para ejecutarlo desde una ventana de código del Management Studio.

A continuación se presentan algunos ejemplos para crear el código de las tablas de la base de datos del Sistema de Vocabulario Ch’ol.

SE [BDCHOL]

GO

/****** Objeto: Table [dbo].[TBLENTPAL] Fecha de la secuencia de comandos: 01/08/2008 08:38:53 ******/

SET ANSI_NULLS ON

GO

SET QUOTED_IDENTIFIER ON

CREATE TABLE [dbo].[TBLENTPAL](

[ID] [numeric](4, 0) NOT NULL,

[PALENTCHL] [nvarchar](200) COLLATE Modern_Spanish_CI_AS NOT NULL,

[PALENTESP] [nvarchar](200) COLLATE Modern_Spanish_CI_AS NOT NULL,

[DEFPALESP] [nchar](250) COLLATE Modern_Spanish_CI_AS NULL,

Script para insertar el contenido de la tablas del sistema traductor.

INSERT INTO TBLENTPAL (PALENTCHL, PALENTESP, DEFPALESP, DEFPALCHL ) VALUES (' Lak' tyâñ Ch'ol ','Nuestra lengua Sig. ‘Nuestra Lengua. // (Maj k'äñ lak tyañ) Usas Nuestra ‘Lengua’’ Suj. Lak' tyañ Ch'ol. // (Nuestra lengua), (Wäl tyi lak' tyañ) Lo dices en nuestra Lengua’);

INSERT INTO TBLENTPAL (PALENTCHL, PALENTESP, DEFPALESP, DEFPALCHL values (' Kaslanty'än ','Español'’ Sig. Español. // (kaslanty'än ) Lengua Español’´ Sub. Kaslanty'än. // (Español), (Wäl tyi kaslanty'an)´ );

En la figura 3 se muestra la ventana principal del proyecto que fue desarrollado y traducido en la lengua maternal ch’ol.

Fig. 3. Pantalla principal del Sistema traductor de lengua


I. Analisis de Resultados


Los resultados del funcionamiento del sistema vocabulario integrando la concordancia de los requisitos funcionales y de rendimiento establecidos, los estándares de desarrollo explícitamente documentados, las características implícitas que se espera de todo software desarrollado profesionalmente, las actividades planificadas fueron inspeccionados para todo el código, se ejecutaron ensayos individuales en cada diseño y se probaron con otros programadores de sistemas, lo que resultó en la corrección de ciertas vulnerabilidades del sistema de vocabulario.

Para efectuar las pruebas del sistema vocabulario ch’ol con interfaz de voz se diseñó un diagrama para pruebas de actividades de software con mejora de resultados:


· Los usuarios que tuvieron la oportunidad de probar el sistema mostraron interés en el software. Al iniciar sesión el sistema se ejecuta de manera gradual.

· Los usuarios mostraron su disposición al utilizar el sistema. Al escribir la palabra clave el sistema mostró las palabras disponibles con las iniciales, entonces el usuario procedió a pinchar la palabra encontrada durante la búsqueda, esperando un tiempo mínimo de 3 a 5 segundos para reproducir el sonido después de hacer doble clic en el panel 2.

· En cuanto al diseño del sistema, los usuarios mostraron una sólida confianza al interactuar con el software.


I. Conclusió

Las tecnologías son una necesidad dentro de todos los procesos, por lo tanto se puede decir que son pocas las tareas que se pueden realizar sin el apoyo de las herramientas informáticas, esto avala el desarrollo del Sistema
Vocabulario Ch’ol. La necesidad de esta herramienta surgió debido a la problemática detectada en la pérdida de la lengua materna y el analfabetismo de los indígenas choles [10], se contempló la posibilidad de aprovechar las herramientas de programación gratuitas que actualmente existen para llevar a cabo esta propuesta.

Como resultado de este trabajo, se cuenta con una base esencial para realizar otras herramientas que ayuden a preservar las lenguas natales de los pueblos indígenas de México. Así mismo aprovechando al máximo la tecnología se pueden construir otros sistemas que ayuden a la formación académica de todos los niños y jóvenes indígenas.

La aplicación del sistema de información en la educación o en la informática educativa, proporciona un dominio de estudio interesante al mezclar los aprendizajes interdisciplinarios (Educación, Medios, Informática y Cultura), al promover un aprendizaje significativo, activo y colaborativo.

El sistema traductor se espera en el futuro agregar reingeniería para el análisis y el desarrollo basado en web. Lo anterior permitirá promover y publicar el uso de la lengua materna, como ejemplo tenemos el sistema “Hacedores de palabras” con acceso vía web y que permite a los internautas navegar dentro de él, tiene cinco traducciones en lenguas indígenas con diferentes contenidos.

AGRADECIMIENTO

Agradezco a Dr. José Cruz Núñez Pérez por su valiosa participación en la revisión de este trabajo..

Ing.Porfirio Candelario López Vázquez por su valioso ayuda para desarrollar el proyecto, http://porfiriolopez.blogspot.com/

Referencias

[1] Meza, J, D’Agostino, G. y Cruz, A. Elementos y características del material impreso, 2003, que favorece la formación y el aprendizaje a distancia en la UNED. San José: UNED.

[2] Rocío Casariego Vázquez. CONAFE, Hacedores de las palabras. 2006, http://hacedores.emexico.gob.mx/

[3] Fuentes Lidia, Vallecillo Antonio, Una introducción a los perfiles de UML, Depto. de Lenguajes y Ciencias de la Computación, 2007, Universidad de Málaga Campus de Teatinos. E29071- Málaga (SPAIN, http://www.lcc.uma.es/~av/Publicaciones/04/UMLProfiles-Novatica04.pdf

[4] Microsoft. Introducción a la plataforma NET. 2006. Manual de Visual Net. www.microsoft.com

[5] Kisching Ingrid, Ahuctzin Angélica, Aplicación de la Tecnología en la Enseñanza del Español, Universidad de la Ameritas-Puebla. Santa Catarina Mártir s/n 72820, Cholula, Puebla

[6] Serrano León Gonzalo, Ingeniería del Sistema de Software, 1996, ISDEFE. España, Pp. 221.

[7] Bruegge Berno, Dotol Allen. Ingeniería de Software Orientado a Objetos, 2002, Prentice Hall. México. Pp. 553.

[8] Ojeda Charte Francisco. Programación Base de datos con Microsoft Visual Basic.NET, 2002, Anaya, Multimedia, España, Pp. 525.

[9] IBM, Fundamentos de RDBMS, 2002, International Business Machine y Microsoft Corporation, Venezuela. Pp.81

[10] ANALI en los medios. Instituto Nacional de Lenguas Indígenas, 2007. Pp9.


Virgilio Rosendo Pérez Pérez. Es Ingeniero en Sistemas Computacionales por la Universidad Autónoma Indígena de México (2003- 2008), realizó estancias de Investigación por la Academia Mexicana de la Ciencia en 2007 en la Universidad Tecnológica de Hermosillo con el tema de investigación en las áreas de “Data WereHouse, Data Minign”. Actualmente se encuentra estudiando la Maestría en Sistemas Digitales en el Centro de Investigación y Desarrollo Tecnológico del Instituto Politécnico Nacional (CITEDI-IPN) en Tijuana, baja California.

Número de validación 1004, hoja 38, Folio RC241114


Tijuana, Baja, california, 17 y 18 de Noviembre del 2008