IPFire Web Categorizer, per catalogare gli url
La comunità internazionale del progetto IPFire ha sviluppato un ulteriore modulo software degno di attenzione, progettato per estendere le funzionalità di analisi e controllo del traffico web: IPFire Web Categorizer.
Descrizione del componente
Il modulo IPFire Web Categorizer è un’estensione applicativa finalizzata alla classificazione automatica dei siti web visitati dagli utenti attraverso il firewall.
Il processo di categorizzazione si basa sull’integrazione con:
- le liste native del sistema URL Filter di IPFire
- database di classificazione aggiuntivi (custom), configurabili dall’amministratore
Il sistema consente quindi una profilazione granulare del traffico HTTP/HTTPS, utile per attività di auditing, controllo accessi e analisi comportamentale della rete.
Download del componente
Il pacchetto è disponibile al seguente repository:
https://www.forum.ipfireitalia.it/index.php?topic=117.0
Procedura di installazione
L’installazione del modulo richiede l’accesso diretto al sistema IPFire (tipicamente via SSH o console) e prevede i seguenti passaggi operativi:
- Trasferire il pacchetto scaricato sul sistema IPFire
- Estrarre il contenuto dell’archivio (formato compresso)
- Copiare la directory risultante nel percorso temporaneo del gestore pacchetti:
- /opt/pakfire/tmp
- Accedere alla directory del pacchetto ed eseguire lo script di installazione:
- ./install.sh
Lo script automatizza la copia dei file, l’integrazione con il sistema Pakfire e la registrazione dei servizi necessari.
Attivazione e configurazione del servizio
Al termine dell’installazione, il servizio risulta già avviato, tuttavia è necessario effettuare alcune configurazioni manuali a livello di codice per completarne l’integrazione.
Configurazione notifiche email
Modificare il file:
/usr/local/bin/categorizer-report-domain.pl
Individuare la variabile:
$REPORT_EMAIL
e impostarla con l’indirizzo email destinatario delle segnalazioni relative ai domini non categorizzati.

Configurazione sorgente database esterno
Modificare il file:
/usr/local/bin/categorizer-update-custom.pl
Configurare la variabile:
$REPO_URL
Questa variabile definisce l’endpoint del repository contenente il database di categorizzazione esterno.
Nota tecnica:
È possibile utilizzare un database remoto (es. NAS o share di rete) oppure, in alternativa, un repository locale sul firewall per ridurre la latenza e migliorare l’affidabilità.

Interfaccia grafica e funzionalità
Una volta configurato, il modulo è accessibile dall’interfaccia web di IPFire sotto il menu Pakfire → Web Categorizer.

L’interfaccia presenta:
- Dashboard temporale con statistiche sull’ultima ora
- Selettore di intervallo temporale (da 5 minuti fino a 1 mese)
- Metriche aggregate, tra cui:
- numero di richieste
- volume di traffico
- percentuali per categoria
- numero di client attivi
Visualizzazione dati
Il sistema include:
- Grafico a barre (bar graph) per la distribuzione delle categorie
- Elenco dettagliato degli URL visitati con relativa classificazione
I siti non presenti nei database vengono etichettati come:
uncategorized
Gestione dei domini non categorizzati
Per ogni URL non classificato è disponibile una funzione di segnalazione tramite email, accessibile tramite apposita icona.
Questa funzionalità consente:
- l’invio automatico al gestore del sistema
- l’integrazione successiva nel database locale o remoto

Monitoraggio per client
La sezione Utenti consente di visualizzare:
- dispositivi attivi (per hostname o indirizzo IP)
- traffico generato per ciascun client
È possibile accedere al dettaglio cliccando sull’indirizzo IP, ottenendo una vista granulare per singolo host.

Esportazione report
Ogni sezione del sistema supporta l’esportazione dei dati in formato:
- HTML, comprensivo di grafici e statistiche
Questa funzione è particolarmente utile per:
- audit di sicurezza
- reportistica aziendale
- analisi forense del traffico
Personalizzazione e gestione database
Il sistema utilizza due database di categorizzazione:
Database locale
Percorso:
/var/ipfire/urlfilter/blacklists/custom
Struttura:
- directory per categoria
- file domain contenente i domini associati
Esempio:
custom-travel/domain
→ airfrance.fr

Database remoto
Consigliato su:
- NAS
- file server di rete
Requisiti:
- accesso in lettura e scrittura
- disponibilità continua

Aggiornamento database
Il sistema aggiorna automaticamente la cache a intervalli regolari.
È comunque disponibile un comando manuale tramite interfaccia per forzare l’aggiornamento.
Accesso non autenticato
Il modulo espone una pagina di consultazione accessibile senza autenticazione amministrativa:
https://<ip_firewall>:444/categorizer/
Questa funzionalità consente la consultazione dei report in modalità read-only, utile per personale non amministrativo.
PS il componente non ufficiale, chiunque lo installi responsabile di eventuali malfunzionamento o problemi di sicurezza, la comunità e lo sviluppatore NON saranno responsabili di malfunzionamenti anche se allertati
Un grazie all'utente che ha realizato questo componente Roberto Peña