Libro Python Aplicado de Eugenia Bahit. GNU/Linux, ciencia de datos, y desarrollo web

Banner de Python Aplicado

Expresiones regulares en Python


Cita con formato IEEE:
E. Bahit, "Expresiones regulares", in Python Aplicado, 4th ed., EBRC Publisher, 2022, pp. 97–100.

Cita con formato APA 7:
Bahit, E. (2022). Expresiones regulares. In Python Aplicado (4th ed., pp. 97–100). EBRC Publisher.

Cita en línea:
(Bahit, 2022)

Python provee de soporte nativo para búsquedas mediante expresiones regulares, de forma similar a Perl.

Una expresión regular es un patrón de caracteres de reconocimiento, que aplicado sobre una cadena de texto, permite encontrar fragmentos que coincidan con dicha expresión.

Para definir los patrones se utilizan caracteres de forma simbólica (es decir, que cada carácter posee un significado particular en el patrón). Por ejemplo, el patrón "^ho" significa «cadena que comienza por las letras ho», y "la$", significa «cadena que finaliza por las letras la». Mientras que el acento circunflejo ^ simboliza los comienzos de cadenas, el signo dólar, simboliza los finales. Los caracteres simbólicos se listan a continuación.

Caracteres simbólicos y sus significados en las expresiones regulares
Caracteres de posición
^ Inicio de cadena $ Final de cadena
Cuantificadores
? Cero o uno * Cero o más
+ Uno o más {n} n veces
{n,} n o más veces {,m} Entre 0 y n veces
{n,m} Entre n y m veces
Agrupamiento
(...) Grupo exacto [...] Caracteres opcionales y rangos
| Operador lógico «or» (A|B) - Usado para expresar un rango [a-z]
Caracteres de formato
\ Caracter de escape para expresar literales: \. (literal del carácter punto) \d Dígito NOTA
Caracteres de posición
. Cualquier carácter excepto el salto de línea \n Salto de línea
\s Espacio en blanco NOTA \w Palabra NOTA
NOTA: En mayúsculas significa lo contrario. Por ejemplo, \S simboliza cualquier carácter que no sea un espacio en blanco.

Búsqueda de patrones

Para realizar búsquedas mediante expresiones regulares en Python, se utiliza el módulo re. La...