J'ai un ensemble de mot qui sont apparue un certain nombre de fois dans un texte.
je dois déterminer leur rang, fréquence, fréquence relative en plus de
modéliser la fréquence relative en employant une distribution uniforme P(X) = a pour une constante a
modéliser la fréquence relative en employant une une distribution de Zipf P(X)=K/ k ou k correspond au rang
la somme des fréquences relatives est égale à 1
j'ai fait le calcule pour la distribution de zipf (incertain du résultat) et j'ai obtenue ainsi la valeur pour la distribution uniforme (je sais pas comment faire ce calcul)
un peu d'aide serait apprécié
Où j'en suis :
on a 5 mot et la somme de la fréquence est 59
Mot rang fréquence fréquence relative
-------------------------------------------------
maison 1 16 0,271 (16/59)
soleil 2 15 0,254 (15/59)
marche 3 11 0,186 (11/59)
tente 4 9 0,152 (9/59)
rue 5 8 0,135 (8/59)
pour zipf, j'ai évaluer la fréquence et ensuite calculé la fréquence relative
pour maison, c'est la même valeur fréquence relative -> 0,271
pour soleil 16/2=8 fréquence relative -> 8/59 = 0,1355
pour marche 16/3=5,33 fréquence relative -> 0,093
pour tente 16/4=4 fréquence relative -> 0,0677
pour rue 16/5=3,2 fréquence relative -> 0,0542
si la somme des 3 fréquences relatives doivent donner 1
on obtient automatiquement comme fréquence relative pour la distribution relative
maison 1-0,271-0,271=0,458
soleil 1-0,254-0,1355=0,6105
marche 1-0,186-0,093=0,721
tente 1-0,152-0,0677=0,7803
rue 1-0,135-0,0542=0,8108
ça me semble élevé comme fréquence de plus je ne sais pas comment la qualité
un peu d'aide seraient apprécier
Répondre