Blacklists UT1

For english version

Contexte

L'Université Toulouse 1 Capitole diffuse depuis quelques années une liste noire d'URLs, gérée par Fabrice Prigent afin de permettre un meilleur contrôle de l'utilisation d'Internet. Cette base, largement utilisée par les écoles, peut s'intégrer dans un grand nombre d'outils libres ou commerciaux, en complément d'autres listes.
Avec le temps le nombre de catégories a fortement augmenté, et leur rôle a changé. La liste que nous fournissons doit être vue comme une catégorisation des sites, plus que comme une liste à bloquer. Par exemple N'oubliez pas que vous pouvez (devez ?) utiliser une catégorie "locale" qui permettrait d'adapter le comportement de votre filtrage. Ainsi les blogs peuvent être interdits de manière générale, mais certains doivent être autorisés pour des raisons pédagogiques.

La licence d'utilisation

Contrat Creative Commons
Cette création est mise à disposition sous un contrat Creative Commons.

Description

Plusieurs catégories sont définies, mais c'est surtout le pornographique qui est activement maintenu.
Pour ceux qui veulent une base de "travail". Je ne mets à jour régulièrement que la base adult qui nous est la plus utile. Si certains d'entre vous décidaient de compléter les autres bases, je me ferais un plaisir de les intégrer dans la mise à jour.
J'ajoute à l'heure actuelle entre 50 et 300 urls par jour (il faut faire des vérifications sur certaines urls) : je ne peux absorber que lentement les ajouts que fait mon robot d'exploration. Veuillez m'en excuser.
Il existe un fichier regroupant toutes les catégories : blacklists.tar.gz C'est la compilation des bases qui sont décrites ci-dessous :
CatégorieNombreDescription
adult1013963 Des sites adultes allant de l'érotique à la pornographie dure.
agressif345 Quelques sites raçistes, antisémites, inçitant à la haine.
arjel68 Sites de pari en ligne certifies par l ARJEL
astrology26 Astrologie
audio-video1997 Quelques sites orientés vers l'audio et la vidéo.
bank1690 Banque en ligne
blog418 Quelques sites hébergeant des blogs.
celebrity651 Tout ce qui concerne l actualite dite people
chat214 Site de dialogue et conversation en ligne.
child27 Tout ce qui est autorisé pour des enfants
cleaning160 Sites pour désinfecter et mettre à jour des ordinateurs.
cooking16 Sites de cuisine
dangerous_material39 Sites décrivant des moyens de créer du matériel dangereux (explosif, poison, etc.).
dating3443 Sites de rencontres
drogue1054 Drogue.
filehosting795 Sites qui hebergent des contenus (video, images, son)
financial77 Informations financieres, bourses.
forums205 Forums.
gambling1101 Sites de jeux en ligne, casino, etc.
games9821 Sites de jeux, en ligne, ou de distributions de jeux.
hacking294 Sites de piratage et d'agressions informatiques.
jobsearch381 Site pour trouver un emploi
lingerie15 Sites de lingerie
liste_bu2594 Une liste trés "univ-tlse1.fr" de sites éducatifs pour notre bibliothèque.
malware127505 Tout site qui injecte des malwares
manga704 Tout ce qui est lié à l'univers des mangas et de la bande dessinée
marketingware180 Sites de marketing tres speciaux
mixed_adult118 Sites qui contiennent des portions adultes non structured
mobile-phone38 Sites pour les mobiles (sonneries, etc.).
phishing63516 Sites de phishing, de piéges bancaires, ou autres.
press66 Tout site de presse d'information
publicite1309 Publicité.
radio177 Sites de radio sur Internet
reaffected8 Sites qui ont change de proprietaire et donc de contenu
redirector74849 Quelques sites qui permettent de contourner les filtres.
remote-control18 Site permettant la prise de controle a distance
sect144 Secte
sexual_education16 Sites qui parlent d education sexuelle et qui peuvent etre detectes comme pornographiques
shopping250 Sites de vente et achat en ligne
social_networks27 Tous les sites de reseaux sociaux
sports171 Sports
strict_redirector74595 Comme redirector, mais avec les moteurs de recherche classiques.
strong_redirector74595 Comme strict_redirector, mais, pour google et autres, on ne bloque que certains termes.
tricheur43 Sites qui expliquent comme tricher aux examens.
warez735 Sites de logiciels pirates.
webmail335 Webmail que l'on trouve sur internet (hotmail, webmail.univ-tlse1.fr, etc.)
Ces listes ont certainement quelques incohérences. Si vous en trouvez signalez le moi fabrice.prigent@univ-tlse1.fr ou bien utilisez l'interface suivante. http://cri.univ-tlse1.fr/cgi-bin/squidguard_modify.cgi.

La constitution des bases

La constitution des bases est faite par le biais de 2 moyens :

Les contributeurs

Cette base n'existe que par le travail de bénévoles, dont plusieurs étrangers. Ceci confère à la base une utilité internationale.

D'autres bases

D'autres personnes maintiennent des bases de données disponibles :

Télécharger la base

Plusieurs moyens sont disponibles :

Autres informations