martes, 28 de marzo de 2017

Analizadores Sintacticos

Analizador sintáctico

El análisis sintáctico convierte el texto de entrada en otras estructuras (comúnmente árboles), que son más útiles para el posterior análisis y capturan la jerarquía implícita de la entrada. Un analizador léxico crea tokens de una secuencia de caracteres de entrada y son estos tokens los que son procesados por el analizador sintáctico para construir la estructura de datos, por ejemplo un árbol de análisis o árboles de sintaxis abstracta.
El análisis sintáctico también es un estado inicial del análisis de frases de lenguaje natural. Es usado para generar diagramas de lenguajes que usan flexión gramatical, como los idiomas romances o el latín. Los lenguajes habitualmente reconocidos por los analizadores sintácticos son los lenguajes libres de contexto. Cabe notar que existe una justificación formal que establece que los lenguajes libres de contexto son aquellos reconocibles por un autómata de pila, de modo que todo analizador sintáctico que reconozca un lenguaje libre de contexto es equivalente en capacidad computacional a un autómata de pila.

Características

• Lee componentes léxicos (tokens)
• Comprueba que el orden de estos corresponde a la sintaxis predeterminada
• Genera errores en caso de que el flujo de tokens no responda a la sintaxis
• Genera árboles de análisis sintáctico
• Se suele conocer como “Parser” Tema 3. Análisis sintáctico descendente Procesadores de lenguaje 5 3.1 Cara
El análisis sintáctico desarrolla el esqueleto de toda la fase de análisis
• Utiliza el analizador léxico como una rutina dentro del análisis sintáctico ( getNextToken() )
• Integra el análisis semántico como un conjunto de rutinas a ejecutar durante la comprobación de la sintaxis

Ventajas y desventajas

Ventaja: son válidos para cualquier gramática libre de contexto.
Desventaja: su excesiva generalidad no permite que los reconocedores estén muy optimizados (son muy lentos)
Ventaja: reconocedores muy rápidos
Desventaja: válidos para gramáticas LL(k)
Desventaja: los reconocedores son rápidos (pero no tanto como los reconocedores top-down)
Ventaja: válidos para gramáticas SLR(k), LRc(k), LALR(k), que son un superconjunto de las gramáticas LL(k)

Aplicabilidad

Realiza el análisis sintáctico de oraciones del español. Se trata de un motor que integra las aplicaciones de análisis morfológico y de desambiguación funcional, con los procesos de generación de árboles de análisis sintáctico y desambiguación estructural.
En la pantalla de la aplicación aparecen los siguientes elementos:
·        Texto de entrada.
·        Zona de resultados. En esta zona aparecen tres botones, que aportan resultados de diferente índole.
·        Botón de análisis sintáctico. Presenta el resultado de cada uno de los distintos  análisis sintácticos de la oración.
·        Botón de desambiguación funcional. Presenta los resultados de la desambiguación funcional de la oración.
·        Botón de análisis morfológico. Presententa el análisis morfológico de cada una de las palabras de la oración analizada.
·        Menú. Las opciones del menú son:
·        Opciones. Permite seleccionar qué opciones de desambiguación se aplican durante el proceso de análisis.
·        Restricciones por frecuencia. Permite descartar resultados con baja frecuencia de aparición en textos ¾puede mejorar la eficiencia de los procesos de desambiguación.
·        Ayuda. Presenta una pantalla de ayuda indicando el funcionamiento del programa.

·        G.E.D.Y.L.C. Enlace a la página web del Grupo de Estructuras de Datos y Lingüística Computacional de la U.L.P.G.C.

No hay comentarios.:

Publicar un comentario