Primera fase del compilador

12.11.2024

El Analizador lexico

Fase lexica

La fase léxica de un compilador es la primera fase del proceso de compilación y que se encarga de transformar un flujo de entrada en un flujo de tokens.

Un compilador es un programa que traduce un programa escrito en un lenguaje fuente a otro equivalente en un lenguaje destino. El funcionamiento de un compilador se divide en dos partes: análisis del código fuente y síntesis del código objeto. 

Su funcion

Su primer funcion es leer los caracteres de entrada y generando como salida una secuencia de componentes léxicos que el analizador sintáctico utiliza para el análisis. Por lo general, esta interacción se implementa convirtiendo el analizador léxico en una subrutina o corrutina del sintáctico, una vez que la instrucciónes recibida desde el analizador sintáctico, se lee los caracteres de entrada hasta que pueda distinguir el siguiente componente léxico. 

Ya que el analizador léxico es la sección del compilador encargada de interpretar el texto original. Además, es posible llevar a cabo algunas tareas adicionales en la interfaz de usuario, como la eliminación de comentarios y espacios en blanco del código fuente mediante caracteres de espacio en blanco, TAB y salto de línea. 

procesos de un analizador lexico

El analizador léxico se basa en una máquina de estados finitos que contiene información sobre las posibles secuencias de caracteres que pueden conformar un token. Las instancias individuales de estas secuencias de caracteres se llaman lexemas.

El analizador léxico, se puede:

  • Construir un diagrama que represente la estructura de los componentes léxicos del lenguaje fuente
  • Traducir el diagrama a un programa para encontrar los componentes léxicos

  

tokens

Los tokens son la unidad más pequeña de programación en C se conoce como token C. Los tokens son palabras clave,que puedenser los:  identificadores, constantes, variables o cualquier otro símbolo que tenga algún significado en el lenguaje C.

Palabras clave:

Son identificadores utilizados por el lenguaje para fines especiales, y no pueden ser utilizadas como identificadores, Por ejemplo, no pueden ser utilizadas como nombres de variables, clases o funciones.

dentificadores:

Es un conjunto de caracteres alfanuméricos de cualquier longitud que sirve para identificar las entidades del programa. Los identificadores pueden ser combinaciones de letras y números.

Constantes:

La palabra constante tiene dos connotaciones sutilmente diferentes aunque relacionadas, que conviene distinguir.

Operadores:

Son un tipo de tokens que pueden aparecer en las expresiones, e indican al compilador la realización de determinadas operaciones matemáticas, lógicas y numéricas. 

Share
© 2024 El Blog de Fernanda Lopez Todos los derechos reservados.
Creado con Webnode Cookies
¡Crea tu página web gratis! Esta página web fue creada con Webnode. Crea tu propia web gratis hoy mismo! Comenzar