Eccoci giunti al terzo capitolo delle nostre riflessioni sulla generazione e manipolazione di wordlist. Il nostro scopo principale non è quello di darvi wordlist pronte all'uso (ci sono anche quelle..) ma piuttosto di spiegare come sia semplice e divertente crearsele da soli.
Nel precedente articolo abbiamo creato uno script in grado di fondere in vari modi parole e termini provenienti da dizionari esterni con date o numeri. Come promesso in questo articolo spieghiamo come ottenere velocemente wordlist di vario genere anche usando il web o file di testo.
Esempio 1 :wordlist nomi propri italiani
Supponiamo ad esempio di voler creare un dizionario contenente tutti i nomi propri maschili e femminili della lingua italiana. Ovviamente la migliore risorsa esistente (oltre a cio' che sciaguratamente ha pubblicato l'agenzia delle entrete l'anno scorso) è il web.
Cercando molto poco giungiamo a questa pagina di wikipedia che raccoglie probabilmente la maggior parte dei nomi italiani esistenti (anche quelli più assurdi). Copiamo il testo contenuto ed incolliamolo su un file di testo che chiameremo nomi-wiki.txt. Eccone una prima parte:
Abaco, Abbondanzio, Abbondazio, Abbondio, Abdenago, Abdon, Abdone, Abelardo, Abele, Abelino, Aberardo, Abilio, Abondio, Abramino, Abramo, Accorso, Accursio, Accurso, Achilla, Achille, Achilleo, Acilio, Acquisto, Acrisio, Adalberto, Adalciso, Adalgerio, Adalgisio, Adalgiso, Adalindo, Adalio, Adamello, Adamino, Adamo, Adastro, Addamiano, Addario, Addiego, Addolorato, Addonizio, Adelaido, Adelasio, etc
Come possiamo notare sono presenti degli spazi, delle virgole e delle maiuscole che sono ovviamente a noi sgraditi; per eliminarli possiamo usare una grande combinazione di comandi linux,ad esempio:
tr "[A-Z][ ][,][.]" "[a-z][\n][\n][\n]"< nomi-wiki.txt >nomi-senzapunteggiatura.txt
in questo modo mettiamo tutte le lettere in minuscolo, sostituiamo la punteggiatura (punti virgole e spazi) con il carattere nuova linea (che è \n). Per semplificare abbiamo usato il semplice comando tr che è descritto qui .
ora non resta che ordinare il tutto ed eliminare tutti i ritorni al carrello (gli "a capo") con il comando:
Ecco pronta la nostra piccola wordlist con 9000 nomi propri italiani: Scaricala!

Ovviamente possiamo usarla con il nostro precedente script per aggiungere le date ai nomi...
Ad esempio appendendo degli anni brevi a ciascuna parola :
Esempio 2 :wordlist elenco comuni italiani
Abbiamo trovato una lista di comuni italiani completa in questo sito . Ecco le prime righe del file:
Abano Terme;PD;VEN;049;35031;http://www.comuni-italiani.it/028/001/
Abbadia Cerreto;LO;LOM;0371;26834;http://www.comuni-italiani.it/098/001/
Abbadia Lariana;LC;LOM;0341;23821;http://www.comuni-italiani.it/097/001/
Abbadia San Salvatore;SI;TOS;0577;53021;http://www.comuni-italiani.it/052/001/
Abbasanta;OR;SAR;0785;09071;http://www.comuni-italiani.it/095/001/
Abbateggio;PE;ABR;085;65020;http://www.comuni-italiani.it/068/001/
Come possiamo notare non possiamo usare il comando di prima in quanto alcuni nomi di comune presentano nel nome uno o più spazi. Notiamo fortuanatamente che ciascun campo è separato da un ';' e quindi possiamo agilmente estrarre solo la prima colonna del fileusando il fantasctico awk impostando come separatore di campo FS il ';' in questo modo:
cat listacomunidisordinata.txt | awk 'BEGIN { FS=";" } { print $1 }' >comuni-italiani.txt
wordlist con 8100 nomi di comuni italiani: Scaricala! 
Osservazioni:
L'anno scorso l'agenzia delle entrate italiana ha reso pubbliche tutte le dichiarazioni dei redditi degli italiani. Questo una volta filtrato si rivela la più grande wordlist italiana conosciuta...Nomi Cognomi,date di nascita...senza dubbio il governo italiano ha compiuto un passo avventato anche dal punto di vista della sicurezza informatica...E chi ha buone orecchie,intenda!
Sostenete il rinnovamento del sito dando un'occhiata ai link pubblicitari che vi interessano.
| Commenti |
|













