Blacklists UT1

For english version

Contexte

L'Université Toulouse 1 Capitole diffuse depuis quelques années une liste noire d'URLs, gérée par Fabrice Prigent afin de permettre un meilleur contrôle de l'utilisation d'Internet. Cette base, largement utilisée par les écoles, peut s'intégrer dans un grand nombre d'outils libres ou commerciaux, en complément d'autres listes.
Avec le temps le nombre de catégories a fortement augmenté, et leur rôle a changé. La liste que nous fournissons doit être vue comme une catégorisation des sites, plus que comme une liste à bloquer. Par exemple N'oubliez pas que vous pouvez (devez ?) utiliser une catégorie "locale" qui permettrait d'adapter le comportement de votre filtrage. Ainsi les blogs peuvent être interdits de manière générale, mais certains doivent être autorisés pour des raisons pédagogiques.

La licence d'utilisation

Contrat Creative Commons
Cette création est mise à disposition sous un contrat Creative Commons.

Description

Plusieurs catégories sont définies, mais c'est surtout le pornographique qui est activement maintenu.
Pour ceux qui veulent une base de "travail". Je ne mets à jour régulièrement que la base adult qui nous est la plus utile. Si certains d'entre vous décidaient de compléter les autres bases, je me ferais un plaisir de les intégrer dans la mise à jour.
J'ajoute à l'heure actuelle entre 50 et 300 urls par jour (il faut faire des vérifications sur certaines urls) : je ne peux absorber que lentement les ajouts que fait mon robot d'exploration. Veuillez m'en excuser.
Il existe un fichier regroupant toutes les catégories : blacklists.tar.gz C'est la compilation des bases qui sont décrites ci-dessous :
CatégorieNombreDescription
adult1054697 Des sites adultes allant de l'érotique à la pornographie dure.
agressif356 Quelques sites raçistes, antisémites, inçitant à la haine.
arjel69 Sites de pari en ligne certifies par l ARJEL
astrology29 Astrologie
audio-video3359 Quelques sites orientés vers l'audio et la vidéo.
bank1696 Banque en ligne
bitcoin254 Sites de bitcoin
blog1471 Quelques sites hébergeant des blogs.
celebrity661 Tout ce qui concerne l actualite dite people
chat226 Site de dialogue et conversation en ligne.
child40 Tout ce qui est autorisé pour des enfants
cleaning167 Sites pour désinfecter et mettre à jour des ordinateurs.
cooking16 Sites de cuisine
dangerous_material42 Sites décrivant des moyens de créer du matériel dangereux (explosif, poison, etc.).
dating3559 Sites de rencontres
dialer0 Sites de dialer
drogue1056 Drogue.
educational_games9 Sites de jeux éducatifs
filehosting833 Sites qui hebergent des contenus (video, images, son)
financial79 Informations financieres, bourses.
forums209 Forums.
gambling1112 Sites de jeux en ligne, casino, etc.
games11128 Sites de jeux, en ligne, ou de distributions de jeux.
hacking295 Sites de piratage et d'agressions informatiques.
jobsearch385 Site pour trouver un emploi
lingerie29 Sites de lingerie
liste_bu2637 Une liste trés "univ-tlse1.fr" de sites éducatifs pour notre bibliothèque.
malware196849 Tout site qui injecte des malwares
manga727 Tout ce qui est lié à l'univers des mangas et de la bande dessinée
marketingware187 Sites de marketing tres speciaux
mixed_adult134 Sites qui contiennent des portions adultes non structurés
mobile-phone46 Sites pour les mobiles (sonneries, etc.).
phishing63523 Sites de phishing, de piéges bancaires, ou autres.
press4447 Tout site de presse d'information
publicite1424 Publicité.
radio483 Sites de radio sur Internet
reaffected8 Sites qui ont change de proprietaire et donc de contenu
redirector102979 Quelques sites qui permettent de contourner les filtres.
remote-control42 Site permettant la prise de controle a distance
sect145 Secte
sexual_education16 Sites qui parlent d education sexuelle et qui peuvent etre detectes comme pornographiques
shopping36389 Sites de vente et achat en ligne
social_networks635 Tous les sites de reseaux sociaux
sports2274 Sports
strict_redirector102705 Comme redirector, mais avec les moteurs de recherche classiques.
strong_redirector102705 Comme strict_redirector, mais, pour google et autres, on ne bloque que certains termes.
translation171 Sites de traduction
tricheur46 Sites qui expliquent comme tricher aux examens.
warez862 Sites de logiciels pirates.
webmail341 Webmail que l'on trouve sur internet (hotmail, webmail.univ-tlse1.fr, etc.)
Ces listes ont certainement quelques incohérences. Si vous en trouvez signalez le moi fabrice.prigent@ut-capitole.fr ou bien utilisez l'interface suivante. http://dsi.ut-capitole.fr/cgi-bin/squidguard_modify.cgi.

La constitution des bases

La constitution des bases est faite par le biais de 2 moyens :

Les contributeurs

Cette base n'existe que par le travail de bénévoles, dont plusieurs étrangers. Ceci confère à la base une utilité internationale.

D'autres bases

D'autres personnes maintiennent des bases de données disponibles, mais elles disparaissent au fur et à mesure...

Télécharger la base

Plusieurs moyens sont disponibles :

Autres informations