E se precisássemos rastrear os valores não numéricos, é simples, utilizamos o ‘\D’, ou seja, existe diferença entre letras maiúsculas e minúsculas. Ver conteúdo
Cada letra representa um comando diferente. Por exemplo, se for necessária uma busca por caracteres numéricos, já sabemos que o ‘\d’, que também pode ser representado como lista [0-9], é uma opção. Ver conteúdo
Com ele, podemos localizar valores entre 0 e 9 dentro de expressões aumentando a abrangência desse recurso. Ele faz um conjunto de metacaracteres do tipo barra-letra e aumenta substancialmente o poder das expressões regulares. Ver conteúdo
Ao longo desta Disciplina, vimos o símbolo ‘\d’, uma barra invertida acompanhada de uma letra que representa um valor numérico. Ver conteúdo
Considerando a timetable do 782, podemos facilmente adicionar os dois pontos substituindo a expressão por ‘$1:$2’. Ver conteúdo
Além de agrupar um conjunto de caracteres, os parênteses também podem ser úteis para realizarmos substituições. Os grupos são naturalmente identificados em ordem numérica e, por isso, na sequência ‘([0-9]{2})([0-9]{2})’ seria identificada como $1$2. Ver conteúdo
Para ficar mais claro, pense na instrução ‘(super l hiper) mercado’. Quais seriam os resultados? Ver conteúdo
Esses blocos ajudam a buscar termos específicos como, por exemplo: ‘a(b|c)d’, que pode dar match com ‘abd’ ou ‘acd’, enquanto ‘ab|cd’ retornará ‘ab’ ou ‘cd’. Ver conteúdo
Esse último exemplo dá dimensão do poder dos metacaracteres utilizados em conjunto. Pode-se trabalhar, ainda, em grupos de caracteres, utilizando os parênteses de abertura e fechamento‘()’. Ver conteúdo
Considere a Tabela de Horários apresentada anteriormente. Caso fosse necessário buscar partidas às 7h30 ou às 9h30, a expressão ‘[\d]7|[\d]9:30’ resolveria o problema. Ver conteúdo
Essa comparação também poderá ser realiza entre listas com o operador barra vertical ‘|’. Dessa forma, poderíamos buscar os artigos em seu formato literal com a instrução ‘A|O’ ou, então, buscar termos entre diferentes listas. Ver conteúdo
Outros Metacaracteres Quanto trabalhamos com listas, sabemos que a expressão ‘^[AO]’ representa uma busca que dará match com algum dos artigos, A ou O, no início da linha. Ver conteúdo
Observe que os metacaracteres ‘^’ e ‘$’ operam nas linhas. Caso seja necessário buscar termos específicos, precisaremos utilizar a borda ‘\b’. Com ela, poderemos buscar palavras específicas por seu prefixo ou sufixo. Ver conteúdo
Alguns dos exemplos são: ^[AO] - localizar linhas iniciadas pelos artigos definidos; [0-9]$ - localiza linhas dígitos ao final da linha e não da palavra; [.;]$ - localiza linhas que encerram com um ponto final ou ponto e vírgula. Ver conteúdo
Metacaracteres Tipo Âncora Os metacaracteres do tipo âncora marcam uma posição específica na linha. As âncoras comumente usadas são o acento circunflexo ‘^’ e o cifrão ‘$’. Ver conteúdo
Faça o teste: qual seria o match da REGEX ‘\d{4}’ para o número de telefone: (99) 99999-9999? Ver conteúdo
É possível buscar o número exato de ocorrências utilizando ‘{valor}’, ou intervalos com ‘{min,max}’ e ‘{min,} Ver conteúdo
Para concluir os metacaracteres quantificadores, temos as chaves ‘{}’. Com elas, podemos especificar exatamente quantas repetições do elemento anterior estamos procurando. Ver conteúdo
Isso, porque exige que um ou mais atributos ‘/’ sejam contemplados, enquanto ‘*html’, em que não existe a ocorrência da entidade, retorna positivo para ambas as tags. Ver conteúdo
Considerando uma página web com código HTML e suas tags de abertura e fechamento, a instrução ‘+html’ daria match apenas com a tag de fechamento. Ver conteúdo
Para buscar as repetições também podemos utilizar o asterisco ‘*’, que retorna o resultado positivo com zero ou mais ocorrências e o sinal de positivo ‘+’, que dá match quando localiza uma ou mais ocorrências. Ver conteúdo
ele é o chamado opcional e sempre dará match se houver ou der ocorrências da entidade anterior. A instrução 'código?' retornaria tanto a palavra ‘código’ quanto a palavra 'códigos' no plural. Ver conteúdo
A categoria de metacaracteres do tipo quantificador permite verificar o número de repetições entre as entidades. Iniciando pelo operador simbolizado pelo ponto de interrogação ‘?’, Ver conteúdo
Metacaracteres Tipo Quantificador Em uma sequência de caracteres, é comum que haja repetições ao longo do documento e quantificar essas ocorrências é fundamental para criarmos REGEX. Ver conteúdo
Além disso, esse é um convite para que você acesse os Materiais Complementares e aprofunde o conhecimento no assunto. Ver conteúdo
Você perceberá que elas são suficientes para cobrir grande parte das combinações e para iniciar suas REGEX de forma muito ampla. Ver conteúdo
Embora existam outras classes, nesta Disciplina, iremos nos concentrar nas que foram apresentadas até agora. Ver conteúdo
Outra forma de atender a solução seria buscar todos os caracteres alfanuméricos, ou seja, letras e números e, então, negar a lista dessa forma ‘[^[:alnum:]]’. Ver conteúdo
A contagem das palavras apresentadas exige que todas as pontuações sejam removidas e com isso a instrução ‘[[:punct:]]’ seria o suficiente para localizar todas as ocorrências e então removê-las. Ver conteúdo