
| Catégorie | Nombre | Description |
|---|---|---|
| adult | 4578103 | Des sites adultes allant de l'érotique à la pornographie dure. |
| agressif | 394 | Quelques sites racistes, antisémites, incitant à la haine. |
| arjel | 69 | Sites de pari en ligne certifiés par l ARJEL |
| associations_religieuses | 1 | Sites d'associations religieuses |
| astrology | 29 | Astrologie |
| audio-video | 3866 | Quelques sites orientés vers l'audio et la vidéo. |
| bank | 1896 | Banque en ligne |
| bitcoin | 336 | Sites de bitcoin |
| blog | 1485 | Quelques sites hébergeant des blogs. |
| celebrity | 673 | Tout ce qui concerne l actualité dite people |
| chat | 264 | Site de dialogue et conversation en ligne. |
| child | 75 | Tout ce qui est autorisé pour des enfants |
| cleaning | 177 | Sites pour désinfecter et mettre à jour des ordinateurs. |
| cooking | 28 | Sites de cuisine |
| cryptojacking | 16283 | Site de mining en hijacking |
| dangerous_material | 50 | Sites décrivant des moyens de créer du matériel dangereux (explosif, poison, etc.). |
| dating | 4262 | Sites de rencontres |
| ddos | 421 | Sites de déni de services |
| dialer | 4 | Sites de dialer |
| doh | 3016 | Serveurs DNS over HTTP ou équivalent |
| download | 4033 | Sites qui permettent de télécharger des logiciels |
| drogue | 1066 | Drogue. |
| educational_games | 11 | Sites de jeux éducatifs |
| examen_pix | 347 | Une liste uniquement réservée aux élèves français passant l examen PIX. NE PAS UTILISER dans d autres circonstances |
| fakenews | 1085 | Site diffusant fakenews |
| filehosting | 938 | Sites qui hébergent des contenus (vidéos, images, sons) |
| financial | 472 | Informations financières, bourses. |
| forums | 225 | Forums. |
| gambling | 5661 | Sites de jeux en ligne, casino, etc. |
| games | 35273 | Sites de jeux, en ligne, ou de distributions de jeux. |
| hacking | 304 | Sites de piratage et d'agressions informatiques. |
| jobsearch | 421 | Site pour trouver un emploi |
| lingerie | 136 | Sites de lingerie |
| liste_bu | 2904 | Une liste très "univ-tlse1.fr" de sites éducatifs pour notre bibliothèque. |
| malware | 104835 | Tout site qui injecte des malwares |
| manga | 838 | Tout ce qui est lié à l'univers des mangas et de la bande dessinée |
| marketingware | 47 | Sites de marketing très spéciaux |
| mixed_adult | 157 | Sites qui contiennent des portions adultes non structurés |
| mobile-phone | 51 | Sites pour les mobiles (sonneries, etc.). |
| phishing | 105187 | Sites de phishing, de pièges bancaires, ou autres. Copie de la catégorie malware. |
| press | 4574 | Tout site de presse d'information |
| publicite | 4108 | Publicité. |
| radio | 540 | Sites de radio sur Internet |
| reaffected | 8 | Sites qui ont changé de propriétaire et donc de contenu |
| redirector | 131610 | Quelques sites qui permettent de contourner les filtres. |
| remote-control | 65 | Site permettant la prise de contrôle à distance |
| residential_proxies | 68 | Site diffusant residential_proxies |
| sect | 145 | Secte |
| sexual_education | 20 | Sites qui parlent d éducation sexuelle et qui peuvent être détectés comme pornographiques |
| shopping | 36860 | Sites de vente et achat en ligne |
| shortener | 449 | Raccoursisseur d'URL |
| social_networks | 704 | Tous les sites de réseaux sociaux |
| sports | 2332 | Sports |
| stalkerware | 23 | Site diffusant des outils d'espionnage pour les particuliers |
| strict_redirector | 131338 | Comme redirector, mais avec les moteurs de recherche classiques. |
| strong_redirector | 131338 | Comme strict_redirector, mais, pour google et autres, on ne bloque que certains termes. |
| translation | 179 | Sites de traduction |
| tricheur | 73 | Sites qui expliquent comme tricher aux examens. |
| tricheur_pix | 85 | Sites bloqués lors des examens PIX en FRANCE uniquement. |
| update | 33 | Sites d'update pour les OS ou les logiciels |
| vpn | 5672 | Site de VPN |
| warez | 1506 | Sites distribuant, entre autres, des logiciels ou vidéos pirates. |
| webmail | 413 | Webmail que l'on trouve sur internet (hotmail, webmail.univ-tlse1.fr, etc.) |
wget --timestamping http://dsi.ut-capitole.fr/blacklists/download/all.tar.gz
cd /tmp mkdir tempo cd tempo rsync -arpogvt rsync://ftp.ut-capitole.fr/blacklist .