Ebook194 pages1 hour
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
By Mario Canton
Rating: 0 out of 5 stars
()
About this ebook
L'utilizzo delle espressioni regolari non è molto diffuso tra autori, scrittori e redattori mentre programmatori, sviluppatori di codice e realizzatori di e-book ne fanno un frequente – e soddisfacente – impiego.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Molti editor e wordprocessor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Sulle espressioni regolari esiste molto poco nella letteratura in lingua italiana; ben altra mole di documentazione è invece a disposizione se si conosce un po' l'inglese.
Chi vorrà approfondire potrà trovare nella bibliografia alla fine di questo testo ottimi suggerimenti per le opere a stampa, di cui – il più delle volte – i loro autori forniscono anche una versione digitale, se si preferisce questa modalità di lettura.
Cosa si può fare con le regex?
Per rispondere, basta considerare che la ricerca di «stringhe» (sequenze di caratteri) da parte di un computer è molto veloce ma estremamente rigida. Con le espressioni regolari diventa invece possibile:
– trovare se esistono nel testo determinate sequenze;
– localizzare stringhe di caratteri che combaciano con le sequenze e sostituirle con qualcosa di diverso;
– estrarre le stringhe che combaciano con le sequenze per poterle riutilizzare diversamente.
Per non annoiare troppo il lettore l'esposizione sarà legata per quanto possibile ad esempi pratici, con i quali saranno illustrate, di volta in volta, le varie funzionalità delle regex. Ovviamente gli esempi saranno quelli che normalmente si trovano di fronte autori, scrittori e redattori.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Molti editor e wordprocessor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Sulle espressioni regolari esiste molto poco nella letteratura in lingua italiana; ben altra mole di documentazione è invece a disposizione se si conosce un po' l'inglese.
Chi vorrà approfondire potrà trovare nella bibliografia alla fine di questo testo ottimi suggerimenti per le opere a stampa, di cui – il più delle volte – i loro autori forniscono anche una versione digitale, se si preferisce questa modalità di lettura.
Cosa si può fare con le regex?
Per rispondere, basta considerare che la ricerca di «stringhe» (sequenze di caratteri) da parte di un computer è molto veloce ma estremamente rigida. Con le espressioni regolari diventa invece possibile:
– trovare se esistono nel testo determinate sequenze;
– localizzare stringhe di caratteri che combaciano con le sequenze e sostituirle con qualcosa di diverso;
– estrarre le stringhe che combaciano con le sequenze per poterle riutilizzare diversamente.
Per non annoiare troppo il lettore l'esposizione sarà legata per quanto possibile ad esempi pratici, con i quali saranno illustrate, di volta in volta, le varie funzionalità delle regex. Ovviamente gli esempi saranno quelli che normalmente si trovano di fronte autori, scrittori e redattori.
Related to RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
Titles in the series (3)
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali. Rating: 0 out of 5 stars0 ratingsRegEx 2: Il trattamento testi con le espressioni regolari Rating: 0 out of 5 stars0 ratingsRegEx3: L'uso delle espressioni regolari nelle applicazioni e nei linguaggi Rating: 1 out of 5 stars1/5
Related ebooks
Il foglio elettronico: ... Tips and tricks ... Rating: 0 out of 5 stars0 ratingsRegEx3: L'uso delle espressioni regolari nelle applicazioni e nei linguaggi Rating: 1 out of 5 stars1/5Programmare in Visual Basic (VB) Rating: 0 out of 5 stars0 ratingsHTML5 canvas in tempo reale Rating: 0 out of 5 stars0 ratingsPython: La Guida Per Imparare a Programmare. Include Esercizi di Programmazione.: Programmazione per Principianti, #1 Rating: 0 out of 5 stars0 ratingsTecnologia e Progettazione per il mondo digitale e per il web III Rating: 0 out of 5 stars0 ratingsProgrammare in C: Introduzione pratica Rating: 0 out of 5 stars0 ratingsSviluppare applicazioni Web con Google Apps Script ed AngularJS Rating: 3 out of 5 stars3/5Tabelle Pivot per tutti. Dalle semplici tabelle alle Power-Pivot: Guida utile per la creazione delle Tabelle Pivot in Excel Rating: 0 out of 5 stars0 ratingsFondamenti di programmazione in C# 11 Rating: 0 out of 5 stars0 ratingsSQLite, il database per tutti Rating: 0 out of 5 stars0 ratingsKung-Fu A Linea Di Comando Rating: 0 out of 5 stars0 ratingsTraduzione e qualità: La valutazione in ambito accademico e professionale. Seconda edizione Rating: 0 out of 5 stars0 ratingsElaborazione del linguaggio naturale con Python Rating: 0 out of 5 stars0 ratingsIl welfare per freelance non è una leggenda metropolitana: Cavarsela con l’INPS in caso di malattia, maternità e altri diritti Rating: 0 out of 5 stars0 ratingsPedagogia dell'emancipazione e valutazione: Dare valore all'apprendimento: idee e pratiche Rating: 0 out of 5 stars0 ratingsPillole di Inglese: 1.Avverbi 2.Pronomi Relativi 3.Verbi Modali Rating: 5 out of 5 stars5/5Programmare In Android Per Principianti Rating: 0 out of 5 stars0 ratingsTime on a Line. Il verbo inglese in 60 minuti Rating: 1 out of 5 stars1/5Impara il Francese: Francese per Bambini. Rana - Grenouille. Racconto Bilingue in Francese e Italiano. Rating: 0 out of 5 stars0 ratingsHeidegger e l'abitare poetico: Per mortem ad vitam Rating: 0 out of 5 stars0 ratingsCome scrivere un curriculum vitae decente Rating: 0 out of 5 stars0 ratingsIvanhoe: Ediz. integrale Rating: 0 out of 5 stars0 ratingsLa nuova ecdl 2013 in pillole Rating: 0 out of 5 stars0 ratingsLe lingue nelle facoltà di lingue. Tra ricerca e didattica Rating: 0 out of 5 stars0 ratingsCreare un blog di successo Rating: 0 out of 5 stars0 ratingsUn'equazione semplice per i numeri Primi Rating: 0 out of 5 stars0 ratingsLa punteggiatura: Regole e contro regole Rating: 0 out of 5 stars0 ratingsLa formattazione condizionale in Excel - Collana "I Quaderni di Excel Academy" Vol. 1 Rating: 5 out of 5 stars5/5
Reference For You
Pratiche Taoiste Rating: 0 out of 5 stars0 ratingsGuida alle Droghe Magiche Rating: 0 out of 5 stars0 ratingsDisegno intuitivo: Manuale pratico per grandi e piccini Rating: 0 out of 5 stars0 ratingsSintetizzatori virtuali: Teoria e tecnica Rating: 0 out of 5 stars0 ratingsLa Tecnica Steiner Rating: 0 out of 5 stars0 ratingsIl Manuale del Manuale del Dungeon Master Rating: 4 out of 5 stars4/5Tutto fa branding: Guida pratica al personal branding Rating: 5 out of 5 stars5/5Come ti inverno la barca in secco Rating: 0 out of 5 stars0 ratingsStoria contemporanea facile: attraverso mappe concettuali, schemi e riassunti Rating: 0 out of 5 stars0 ratingsCome fare editing Rating: 0 out of 5 stars0 ratingsMANUALE PER SCRITTORI 3.0 - La professione più ambita del Web: Trucchi e Segreti per scrivere da professionisti Rating: 0 out of 5 stars0 ratingsDizionario del sesso e dell'erotismo Rating: 5 out of 5 stars5/5L'idea narrativa: Scrivere narrativa 7 Rating: 0 out of 5 stars0 ratingsIl viaggio dello scrittore: Scrivere narrativa 6 Rating: 0 out of 5 stars0 ratingsCome si scrive un film: Scrivere cinema 1 Rating: 0 out of 5 stars0 ratings101 cose da fare a Torino almeno una volta nella vita Rating: 0 out of 5 stars0 ratingsSi scrive così… o come? Rating: 0 out of 5 stars0 ratingsIl manuale del mozzo Rating: 0 out of 5 stars0 ratingsTutti i segreti di Word per chi scrive Rating: 0 out of 5 stars0 ratingsCapuana e la letteratura per l'infanzia Rating: 0 out of 5 stars0 ratingsCreatività - Istruzioni per l'uso Rating: 4 out of 5 stars4/5Tutti i segreti di Scrivener 3 per chi scrive Rating: 0 out of 5 stars0 ratingsLa Divina Commedia e il simbolo nascosto Rating: 0 out of 5 stars0 ratingsPresent Past Future: I tempi verbali in Inglese Rating: 0 out of 5 stars0 ratingsVerbi e punteggiatura Rating: 0 out of 5 stars0 ratingsScrivere ganzo!: Consigli per comunicare alla grande dal romanzo all'online Rating: 5 out of 5 stars5/5Nozioni di base sul vino Rating: 0 out of 5 stars0 ratingsLa grammatica fondamentale: Scrivere bene 1 Rating: 0 out of 5 stars0 ratingsPronto Soccorso e Naturopatia. Curarsi a casa con i prodotti della natura Rating: 0 out of 5 stars0 ratingsVendere Handmade: Una guida completa per trasformare la tua passione in professione Rating: 0 out of 5 stars0 ratings
Reviews for RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
Rating: 0 out of 5 stars
0 ratings
0 ratings0 reviews
Book preview
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali. - Mario Canton
RegEx
per autori,
scrittori
e redattori
Guida operativa
all'utilizzo
delle espressioni regolari
nel trattamento
di testi digitali
— Edizione digitale 2016 —
a cura di Mario Canton
PROPRIETÀ INTELLETTUALE LETTERARIA RISERVATA
© Copyright 2016 by Mario Canton
1ª edizione digitale – 2016
––=ooOoo=––
Qualora si volesse condividere questo e-book con un’altra persona, si chiede cortesemente di scaricare una copia a pagamento per ciascuna delle persone a cui lo si vuole destinare.
Se si sta leggendo questo e-book e non lo si è acquistato, qualora risulti di gradimento, si chiede, per favore, di acquistarne anche una copia a pagamento, al fine di poter permettere la continuità e la crescita del lavoro e la possibilità di offrire sempre più titoli e una qualità sempre maggiore.
Grazie per l'aiuto e per aver rispettato il lavoro dell’autore, redattore ed editore di questo libro.
Data la rapidità con cui gli strumenti di sviluppo e i linguaggi vengono aggiornati, i contenuti di questo e-book si intendono fedeli allo stato dell’arte al momento della pubblicazione, come pure il livello di aggiornamento dei dati.
––=ooOoo=––
Nota
Se il Lettore fosse cortesemente disponibile a collaborare al miglioramento dell'opera, può segnalare qualsiasi refuso e/o errore operativo riscontrato nella lettura dell'e-book utilizzando una e-mail da inviare all'indirizzo dell'autore.
Si veda l'indirizzo in calce all'introduzione al testo o al colophon.
L'autore si impegna ad apportare quanto prima possibile le correzioni ritenute opportune o necessarie.
Si ringrazia sin d'ora per l'eventuale collaborazione.
––=ooOoo=––
Avvertenza
Ogni sforzo è stato fatto per rendere questo libro il più completo e il più accurato possibile, ma non è implicita alcuna garanzia sulla perfetta correttezza dei contenuti.
Le informazioni sono fornite «così come sono».
Pertanto, NON si assume alcune responsabilità per la perdita di dati o altri danni derivanti dall'applicazione delle informazioni contenute di questa pubblicazione.
––=ooOoo=––
Indice
Introduzione
Due parole sull'origine
L'utilizzo delle espressioni regolari
Terminologia
Differenti «motori» delle RegEx
Un prima prova con le RegEx
Gli operatori fondamentali per la ricerca
Un ricerca base
Il punto
Le cifre
Gli spazi
Gli insiemi di caratteri (set)
Le sequenze di caratteri [ - ]
Tutti i caratteri «tranne» [^ ]
Le parole
Ancore
I caratteri di una parola \w
Non-codici
I confini di una riga
I confini di tutto un testo
I quantificatori Uno o più caratteri: +
I quantificatori Zero o più caratteri: *
I quantificatori Zero o uno: ? (eventualità)
I quantificatori Il numero di ripetizioni: { }
Quantificatori avidi o pigri (greedy o lazy)
I raggruppamenti: Il riferimento all'indietro (backreference)
I raggruppamenti: I gruppi di espressioni (…)
I raggruppamenti: Il gruppo nominato (?P< > )
I raggruppamenti: Il gruppo passivo (?: )
I raggruppamenti: L'espressione condizionale (?: )
I raggruppamenti: L'alternativa: |
La codifica: Unicode
La codifica: ASCII
Guardarsi intorno (lookaround)
Guarda avanti se diverso (?! )
Guardarsi intorno (lookaround)
Guarda avanti se uguale (?= )
Guardarsi intorno (lookaround)
Guarda indietro (?
Caratteri particolari: bell \a (alarm)
Caratteri particolari: Carattere di controllo \c
Caratteri particolari: Carattere di escape \e
Caratteri particolari: Carattere form feed \f
Caratteri particolari: Caratteri a-capo e ritorno carrello \n e \r
Caratteri particolari: Caratteri di tabulazione \v e \t
Commento (?# )
I modificatori: Maiuscole e minuscole uguali /i
I modificatori: Modalità singola riga /s
I modificatori: Modalità multi-riga /m
Errori e incovenienti
Backtracking quantificatori possessivi e gruppi atomici
Individuare un file HTML completo
Ripetere un gruppo catturato e ragruppare un gruppo ripetuto
Le sostituzioni
Esempi
Individuare tag in (X)HTML
Eliminare gli spazi vuoti
Indirizzi IP
Individuare numeri in virgola mobile
Trovare e validare un indirizzo e-mail
Individuare una data valida
Individuare una intera linea di testo
Trovare linee che contengono (o non contengono) determinate parole
Cancellare linee duplicate in un file
Rimuovere parti duplicate in una stringa
Individuare commenti
Individuare stringhe
Individuare numeri
Individuare parole particolari o parole chiave
Trovare due parole vicine l’una all’altra
Espressioni regolari per e-book
Trasformare gli spazi doppi in spazi singoli
Cancellare tutti i tabulatori
Cancellare le linee bianche (con codifica Windows)
Eliminare gli spazi vuoti di inizio riga
Eliminare gli spazi vuoti a fine riga
Eliminare le interruzione di riga interne ai paragrafi
Inserire tutte le linee tra i tag di paragrafo «
Aggiungere una «class» alle interruzioni di sezione
Aggiungere un attributo «alt» a tutte le immagini
Sostituire «&» con «&»
Sostituire apostrofi normali con apostrofi orientati
Modificare la marcatura dei titoli
Cambiare il formato delle date
Trovare caratteri speciali
Trovare caratteri speciali (escludendo apici inclinati e lineette)
Aggiungere lo stile «centrato» alle interruzioni di sezione stile Markdown
Cancellare le linee bianche con esclusione dell’ultima
Aggiungere ai capitoli lo stile «capitolo»
Sostituire i tag segnaposto nei file XHTML provenienti da file di word processor
Prospetti riassuntivi di riferimento
Metacaratteri definiti con esempi
Escape di caratteri
Classi di caratteri
Modificatori
Lista di alcuni editor con le varianti di regex supportate
RegEx Tester, online e installabili
Bibliografia essenziale
Manuali generali
Manuali su Perl con parti specifiche sulle espressioni regolari
Manuali specifici
Alla memoria
del prof. Stephen Cole Kleene,
(* 5.1.1909 † 25.1.1994)
con somma gratitudine ...
... per tutta la fatica evitata,
per tutta la precisione ottenuta
e per tutto il tempo della mia vita
risparmiato e dedicato ad altro.
Introduzione
Non ricordo più quando è stato il momento preciso in cui ho scoperto le espressioni regolari, ma posso dire che da allora trattare testi è diventato molto meno faticoso.
L'utilizzo delle espressioni regolari non è molto diffuso tra autori, scrittori e redattori mentre programmatori, sviluppatori di codice e realizzatori di e-book ne fanno un frequente – e soddisfacente – impiego.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Delle regex esistono molte varianti (chiamate «flavours», letteralmente «sapori, gusti o aromi») ma sostanzialmente la logica è sempre la stessa e la sintassi non presenta moltissime differenze.
Qui sarà trattata la sintassi relativa alla libreria PCRE (Perl Compatible Regular Expressions) cioè a quelle istruzioni che sono accettate dai software che utilizzano un funzionamento delle regex compatibile con quello del linguaggio Perl, da cui peraltro le regex sono state destinate a un impiego operativo.
PCRE è una libreria sviluppata in linguaggio «C» ed è perciò estremamente efficiente e veloce.
Molti editor e word processor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Un editor particolarmente utilizzato è Notepad++ ma anche il famosissimo Word di Microsoft, oppure l'open source LibreOffice (e il precedente OpenOffice) o ancora editor per
Enjoying the preview?
Page 1 of 1