lundi 4 mai 2009

L'utilité du label BA

Je poursuis sur le problème des BA et des AdQ.

Officiellement le label Bon Article est prévu pour récompenser (est-ce vraiment le terme adéquat ?) un article qui a des qualités mais pas suffisantes pour avoir le label Article de qualité... cela se traduit soit
* par une frange d'article dont les votes au second tour sur la proposition AdQ entre dans la formule suivante (votes AdQ+votes BA) /(votes AdQ+votes BA+votes Attendre) > 66% mais < 75%
* par les articles ayant plus de 66% de vote BA sur la proposition BA

Ajoutez à cela l'obligation de plus de cinq votes... mais c'est rare qu'il y en ai moins. Dans un sens c'est facile, ceux sont des maths basiques qui permettent de définir si un article obtient un label ou non... mais le vote est lui beaucoup plus subjectif.

Si on se réfère à Wikipédia:Bons articles/Règles et surtout Wikipédia:Qu'est-ce qu'un bon article ?, on ne peut pas dire que la définition soit vachement claire... mais c'est normal, on touche à des notions de rhétorique, de synthèse, en gros des trucs littéraires, pas des simples chiffres !

Dans les articles que j'ai proposé à la labellisation, exclusivement Disney, parmi les critères souvent pointés par les votants, j'ai relevé
* le nombre de liens rouges
* le nombre d'images
* la longueur de l'article
* le nombre de références

Mais, je me rends compte que les remarques sont toutefois plus quantitatives que qualitatives... donc c'est plus une question de chiffres que de notions de fond. Comme quoi on en revient toujours à des chiffres... c'est un peu dommage.

Depuis déjà quelques temps, j'ai un tableau qui tente d'exprimer en chiffre les deux valeurs que je trouve les plus représentatives des notions de fond, le nombre de références et la taille de l'article. Pour dire tout, c'est depuis la proposition en AdQ de Donald Duck... logique elle s'est terminée par un BA alors qu'elle est pourtant assez développée, mais cela n'a pas satisfait tout le monde. Étant un peu rancunier, je dirai que c'est bizarre car je ne les ai jamais vu sur l'article ni avant, ni après, pourtant vu leurs remarques ont aurait pu pensé qu'ils avaient des informations à ajouter... puisqu'elles étaient absentes à leur yeux... mais bon, c'est comme ça.

Revenons à ce tableau. Que voici sous vos yeux ébahis...





















ArticleStatutdate obtentiontaille (oct)nb refprorata 1 [1]prorata 2 [2]
Bambi (film, 1942)17 296821,620,46ébauche
Dumbo (film, 1941)24 181259,671,03ébauche
Laugh-O-Gram BA 19/02/200932 229398,261,21Bon pour BA
Le Dragon récalcitrantpBA 33 553388,831,13Bon pour BA
Minnie Mouse BA 05/09/200833 790349,941,01Bon pour BA
Disneyland BA 15/06/200747 7482916,460,61Bon pour BA
Oswald le lapin chanceux BA 16/03/200951 4033614,280,70Bon pour BA
Alice Comedies BA 25/12/200864 323709,191,09Bon pour BA
The Walt Disney Company BA 06/06/200767 8076111,120,90Bon pour BA
Walt Disney Pictures82 828968,631,16améliorer vers AdQ
Dingo (Disney) ADQ 10/09/200884 9961097,801,28Bon pour AdQ
Silly Symphonies ADQ 03/08/200892 3951019,151,09Bon pour AdQ
Donald Duck BA 16/01/200897 5108012,190,82améliorer vers AdQ
Walt Disney ADQ 15/07/2005106 2151079,931,01Bon pour AdQ
Pinocchio (film, 1940) ADQ 01/05/2009132 1941578,421,19Bon pour AdQ
Mickey Mouse ADQ 02/10/2007132 2671399,521,05Bon pour AdQ
Fantasia (film, 1940) pADQ30/05/2009177 0591978,991,11Bon pour AdQ
Blanche-Neige et les Sept Nains ADQ 25/12/2008177 4752158,251,21Bon pour AdQ


[1] pourcentage d'octet pour 1 référence
[2] REF par Mo de texte


Là il est classé par ordre croissant de taille (en octet).

On peut remarquer qu'au dessus de 80 000 octets, un article a de forte chance d'être un AdQ, exception:
* Walt Disney Pictures (heuresement que c'était une pBA car il ne l'a même pas obtenu), bon c'est normal les utilisateurs s'attendent à un haut niveau d'analyse...
* Donald Duck, là j'ai l'impression que le fait d'avoir moins de 100 références et quelques notions de fond ont été rédhibitoires. Mais bon, on en reviendra aux chiffres car de nouvelles sources augmenterons les notions...

Pour ce qui est des BA, je note un intervalle de taille compris entre 30 000 et 80 000 octets avec si possible un taux de 1 référence pour 1000 octets... taux aussi valable pour les AdQ.

Bon pour ceux qui aiment les petits graphiques en voici un.



Au final, à part le critère de la longueur de l'article, tout article avec un taux de 1 référence pour 1000 octets est potentiellement labellisable... ensuite l'obtention du label ne dépendant plus que des notions d'expertises, de fond, de traitement du sujet.

Ok je n'ai fait cela que sur Disney. Désolé, je ne suis pas assez doué en codage pour faire des stats plus générales sur le toolserver... mais je suis prêt à aider.

1 commentaire:

Jean-Fred a dit…

Ça fait un peu aigri comme billet, tu as dû souffrir en vote de labels.

Dans mon domaine, j'ai pas constaté ce phénomène (en tout cas pas à ce point).

Au final, plus l'article est long, plus il a d'appels de refs, ça paraît logique. Et pour les bouquins, avec le système de mettre la page, le nombre de refs augmente avec.

P.S. "pourcentage d'octet pour 1 référence" ? Pas "nombre d'octet par ref plutôt" ?