Analizador
sintáctico
El
análisis sintáctico convierte el texto de entrada en otras estructuras
(comúnmente árboles), que son más útiles para el posterior análisis y capturan
la jerarquía implícita de la entrada. Un analizador léxico crea tokens de
una secuencia de caracteres de entrada y son estos tokens los
que son procesados por el analizador sintáctico para construir la estructura de
datos, por ejemplo un árbol de análisis o árboles de sintaxis abstracta.
El
análisis sintáctico también es un estado inicial del análisis de frases de
lenguaje natural. Es usado para generar diagramas de lenguajes que usan flexión
gramatical, como los idiomas romances o el latín. Los lenguajes habitualmente
reconocidos por los analizadores sintácticos son los lenguajes libres de contexto.
Cabe notar que existe una justificación formal que establece que los lenguajes
libres de contexto son aquellos reconocibles por un autómata de pila, de modo que todo analizador
sintáctico que reconozca un lenguaje libre de contexto es equivalente en
capacidad computacional a un autómata de pila.
Características
• Lee componentes
léxicos (tokens)
• Comprueba que
el orden de estos corresponde a la sintaxis predeterminada
• Genera
errores en caso de que el flujo de tokens no responda a la sintaxis
• Genera
árboles de análisis sintáctico
• Se suele
conocer como “Parser” Tema 3. Análisis sintáctico descendente Procesadores de
lenguaje 5 3.1 Cara
El análisis
sintáctico desarrolla el esqueleto de toda la fase de análisis
• Utiliza el
analizador léxico como una rutina dentro del análisis sintáctico (
getNextToken() )
• Integra el
análisis semántico como un conjunto de rutinas a ejecutar durante la
comprobación de la sintaxis
Ventajas y desventajas
Ventaja: son
válidos para cualquier gramática libre de contexto.
Desventaja: su
excesiva generalidad no permite que los reconocedores estén muy optimizados
(son muy lentos)
Ventaja:
reconocedores muy rápidos
Desventaja:
válidos para gramáticas LL(k)
Desventaja: los
reconocedores son rápidos (pero no tanto como los reconocedores top-down)
Ventaja:
válidos para gramáticas SLR(k), LRc(k), LALR(k), que son un superconjunto de
las gramáticas LL(k)
Aplicabilidad
Realiza el análisis sintáctico de oraciones del español. Se trata de un
motor que integra las aplicaciones de análisis morfológico y de desambiguación
funcional, con los procesos de generación de árboles de análisis sintáctico y
desambiguación estructural.
En la pantalla de la aplicación aparecen los
siguientes elementos:
· Texto de entrada.
· Zona de resultados. En esta zona
aparecen tres botones, que aportan resultados de diferente índole.
· Botón de análisis sintáctico.
Presenta el resultado de cada uno de los distintos análisis
sintácticos de la oración.
· Botón de desambiguación
funcional. Presenta los resultados de la desambiguación funcional de la
oración.
· Botón de análisis morfológico.
Presententa el análisis morfológico de cada una de las palabras de la oración
analizada.
· Menú. Las opciones del menú son:
· Opciones. Permite seleccionar qué
opciones de desambiguación se aplican durante el proceso de análisis.
· Restricciones por frecuencia. Permite
descartar resultados con baja frecuencia de aparición en textos ¾puede
mejorar la eficiencia de los procesos de desambiguación.
· Ayuda. Presenta una pantalla de
ayuda indicando el funcionamiento del programa.
· G.E.D.Y.L.C. Enlace a la página
web del Grupo de Estructuras de Datos y Lingüística Computacional de la
U.L.P.G.C.
No hay comentarios.:
Publicar un comentario