Blacklists UT1

For english version

Contexte

L'Université Toulouse 1 Capitole diffuse depuis quelques années une liste noire d'URLs, gérée par Fabrice Prigent afin de permettre un meilleur contrôle de l'utilisation d'Internet. Cette base, largement utilisée par les écoles, peut s'intégrer dans un grand nombre d'outils libres ou commerciaux, en complément d'autres listes.
Avec le temps le nombre de catégories a fortement augmenté, et leur rôle a changé. La liste que nous fournissons doit être vue comme une catégorisation des sites, plus que comme une liste à bloquer. Par exemple N'oubliez pas que vous pouvez (devez ?) utiliser une catégorie "locale" qui permettrait d'adapter le comportement de votre filtrage. Ainsi les blogs peuvent être interdits de manière générale, mais certains doivent être autorisés pour des raisons pédagogiques.

La licence d'utilisation

Contrat Creative Commons
Cette création est mise à disposition sous un contrat Creative Commons.

Description

Plusieurs catégories sont définies, mais c'est surtout le pornographique qui est activement maintenu.
Pour ceux qui veulent une base de "travail". Je ne mets à jour régulièrement que la base adult qui nous est la plus utile. Si certains d'entre vous décidaient de compléter les autres bases, je me ferais un plaisir de les intégrer dans la mise à jour.
J'ajoute à l'heure actuelle entre 50 et 300 urls par jour (il faut faire des vérifications sur certaines urls) : je ne peux absorber que lentement les ajouts que fait mon robot d'exploration. Veuillez m'en excuser.
Il existe un fichier regroupant toutes les catégories : blacklists.tar.gz C'est la compilation des bases qui sont décrites ci-dessous :
CatégorieNombreDescription
adult1094647 Des sites adultes allant de l'érotique à la pornographie dure.
agressif355 Quelques sites racistes, antisémites, incitant à la haine.
arjel69 Sites de pari en ligne certifiés par l ARJEL
associations_religieuses1 Sites d'associations religieuses
astrology29 Astrologie
audio-video3392 Quelques sites orientés vers l'audio et la vidéo.
bank1697 Banque en ligne
bitcoin254 Sites de bitcoin
blog1471 Quelques sites hébergeant des blogs.
celebrity668 Tout ce qui concerne l actualité dite people
chat227 Site de dialogue et conversation en ligne.
child43 Tout ce qui est autorisé pour des enfants
cleaning167 Sites pour désinfecter et mettre à jour des ordinateurs.
cooking16 Sites de cuisine
dangerous_material49 Sites décrivant des moyens de créer du matériel dangereux (explosif, poison, etc.).
dating3567 Sites de rencontres
ddos57 Sites de déni de services
dialer0 Sites de dialer
download66 Sites qui permettent de télécharger des logiciels
drogue1055 Drogue.
educational_games9 Sites de jeux éducatifs
filehosting833 Sites qui hébergent des contenus (vidéos, images, sons)
financial79 Informations financières, bourses.
forums209 Forums.
gambling1114 Sites de jeux en ligne, casino, etc.
games11133 Sites de jeux, en ligne, ou de distributions de jeux.
hacking301 Sites de piratage et d'agressions informatiques.
jobsearch385 Site pour trouver un emploi
lingerie51 Sites de lingerie
liste_bu2649 Une liste très "univ-tlse1.fr" de sites éducatifs pour notre bibliothèque.
malware250761 Tout site qui injecte des malwares
manga729 Tout ce qui est lié à l'univers des mangas et de la bande dessinée
marketingware203 Sites de marketing très spéciaux
mixed_adult152 Sites qui contiennent des portions adultes non structurés
mobile-phone46 Sites pour les mobiles (sonneries, etc.).
phishing63522 Sites de phishing, de pièges bancaires, ou autres.
press4447 Tout site de presse d'information
publicite1429 Publicité.
radio491 Sites de radio sur Internet
reaffected8 Sites qui ont changé de propriétaire et donc de contenu
redirector117614 Quelques sites qui permettent de contourner les filtres.
remote-control42 Site permettant la prise de contrôle à distance
sect144 Secte
sexual_education18 Sites qui parlent d éducation sexuelle et qui peuvent être détectés comme pornographiques
shopping36396 Sites de vente et achat en ligne
shortener260 Raccoursisseur d'URL
social_networks636 Tous les sites de réseaux sociaux
sports2275 Sports
strict_redirector117335 Comme redirector, mais avec les moteurs de recherche classiques.
strong_redirector117335 Comme strict_redirector, mais, pour google et autres, on ne bloque que certains termes.
translation171 Sites de traduction
tricheur46 Sites qui expliquent comme tricher aux examens.
update4 Sites d'update
warez866 Sites distribuant, entre autres, des logiciels ou vidéos pirates.
webmail341 Webmail que l'on trouve sur internet (hotmail, webmail.univ-tlse1.fr, etc.)
Ces listes ont certainement quelques incohérences. Si vous en trouvez signalez le moi fabrice.prigent@ut-capitole.fr ou bien utilisez l'interface suivante. http://dsi.ut-capitole.fr/cgi-bin/squidguard_modify.cgi.

La constitution des bases

La constitution des bases est faite par le biais de 2 moyens :

Les contributeurs

Cette base n'existe que par le travail de bénévoles, dont plusieurs étrangers. Ceci confère à la base une utilité internationale.

D'autres bases

D'autres personnes maintiennent des bases de données disponibles, mais elles disparaissent au fur et à mesure...

Télécharger la base

Plusieurs moyens sont disponibles :

Autres informations