9. Depende de opções como case-insensitive Regex Padrão def abc def ghi a J a ck is a boy
10.
11. Caracteres não-imprimíveis Caracter Código Horizontal Tab (0x09) Carriage Return (0x0d) New Line (0x0a) Bell (0x07) Escape (0x1b) Form Feed (0x0c) Vertical Tab(0x0b) 00 Caracter (0x00) FFFF Unicode (0xffff)
12.
13.
14.
15. Classes de caracteres (cont.) Classe Expressão Word Character [A-Za-z0-9] Non Word Character [^A-Za-z0-9] Whitespace Character [ ] Non Whitespace Character [ ] Digit [0-9] Non Digit [^0-9]
Ex: Editor de texto Serve tanto para busca como para replace Além de expressoes possue variantes: Posix, PCRE, Java, .Net Formado por sequencias e metacaracteres
Em java podem ser utilizados teoria dos conjuntos
Java -> Posix Expressions
Dot é o mais error-prone Não é meta dentro de [ ]
-> ancora de tamanho zero
Primeiro executará ”.” até o fim e depois volta (backtrack) até ”</EM>” -> Demonstrar
Referencias podem ser utilizadas em editores para a substituicao de palavras
- Exemplo interessante - -> necessário para separar palavra (backtrack) - grupo de captura é sobrescrito pela última captura - (x)(y) -> 21
Grupo atomo e qualificadores possessivos sao equivalentes Demonstrar backtrack -> depois de encontrar bc, esquece o backreference e c nao valida
Apenas um teste, não é incluído no resultado da busca
Somente retorna ”q” na expressão diferente do exemplo da classe que retorna qu
Otimizando 1 -> pode-se remover pois ja foi encontrado no lookahea Otimizando 2 -> w{0,3} é mais eficiente que w*