Dyskusja kategorii:Listy frekwencyjne

Treść strony nie jest dostępna w innych językach.
Z Wikisłownika – wolnego słownika wielojęzycznego

Rankingi frekwencyjne według wystąpień w innych wikisłownikach[edytuj]

Skoro istnieją "Rankingi brakujących słów według wystąpień w innych wikisłownikach" to czy nie można by zrobić analogicznych list frekwencyjnych ale z dowolnymi słowami? Widzę tu trzy zalety: 1. Zgaduję że będą dotyczyć znacznie większej ilości języków niż obecne listy frekwencyjne (tak samo jak "rankingi brakujący słów") 2. Wbrew nazwie nie będą obejmować jedynie pojedynczych słów (tak samo jak "rankingi brakujących słów") 3. Spójność, ten sam format, to samo źródło dla wielu języków 37.47.64.194 (dyskusja) 00:42, 30 mar 2024 (CET)[odpowiedz]

W zasadzie ja te listy już generuję, tylko nigdy ich nie wrzucałem do projektu, bo czołówka takiej listy niewiele ma wspólnego z prawdziwą częstością słów w danym języku. W prawie każdym języku na pierwszym miejscu wychodzi woda. Olaf (dyskusja) 09:31, 30 mar 2024 (CET)[odpowiedz]
Np. dla angielskiego wygląda to w tej chwili tak:

1-10[edytuj]

  • water 130 (pl af am an ar ast ay az be bg bjn bn br ca chr ckb co cs csb cy da de dv el en eo es et eu fa fi fj fo fr fy ga gd gl gv hi hr hsb hu hy ia id ie io is it iu ja jv kk km ko ks ku kw ky lb lmo ln lo lt lv mg mi mk ml mn mnw ms mt my na nah nds nl no oc om or pa pt qu ro roa-rup ru rw scn sd sg si simple sk sl sm sq sr sv sw ta te tg th ti tk tl tpi tr ts ug uk ur uz vi vo wa yue za zh zh-min-nan zu kazojć zpksoft slovnyk framenet cfd commons)
  • dog 117 (pl af am an ar ast ay az be bg bjn bn br bs ca chr ckb co cs cy da de el en eo es et eu fa fi fj fo fr fy ga gd gl gv hi hr hu hy ia id ie io is it ja ka kk ko ks ku kw ky la lb lmo lo lt lv mg mi mk mn mnw mt my na nah nds nl no oc om pa pt ro roa-rup ru sa sg sh simple sk sl sm sq sr sv sw ta te tg th ti tl tr ts ug uk ur uz vi vo yue zh zh-min-nan zu kazojć zpksoft apertium slovnyk framenet cfd commons)
  • cat 109 (pl af am an ar ast ay az bg bjn bn br bs ca chr ckb co cs cy da de el en eo es et eu fa fi fj fo fr fy ga gd gl gv hi hr hu hy ia id io is it ja jv ka kk km ko ku la lb lmo lo lt lv mg mi mk ml mnw ms mt my nah nds nl no om pa pt ro roa-rup ru sg shn si simple sk sl sm sq sv sw ta te tg th tl tr ug uk ur uz vi wa yue zh zh-min-nan zu kazojć zpksoft apertium slovnyk cfd commons)
  • bird 108 (pl af an ar ast az be blk bn br bs ca chr co cs cy da de dv el en eo es et eu fa fi fj fo fr fy ga gd gl gv hi hr hu hy id io is it iu ja ka ko ku kw ky lmo lo lt lv mg mi mk ml mn my nah nl no oc om pa pt ro ru sa scn sg shn si simple sk sm sq sr sv sw ta te tg th ti tk tpi tr tt ug uk ur uz vi vo wa yue zh zh-min-nan zu kazojć zpksoft apertium slovnyk framenet cfd commons)
  • eye 104 (pl af am an ar ast ay az bn br ca ckb co cs cy da de el en eo es et eu fa fi fj fo fr fy ga gl gor gv hi hr hu hy ia id ie io is it iu ja kk km ko ks ku kw ky la lb lmo lo lt lv mg mk mt my na nah nl no oc om pt ro roa-rup ru sa sg shn simple sk sm sq sr sv ta te tg th ti tpi tr ug uk ur uz vi wa zh zh-min-nan zu kazojć zpksoft apertium slovnyk framenet cfd commons)
  • rain 102 (pl af am an ar az be blk bn br bs ca co cs cy da de dv el en eo es et eu fa fi fo fr fy gl gv hi hr hu hy id io is it iu ja kk km ko ku kw lb li lmo lo lt lv mg mi mk ml mn mnw my nah nds nl no oc om pt ro ru sg si simple sk sm sq sr sv sw ta te tg th tk tl tpi tr uk ur uz vec vi wa yue zh zh-min-nan zu kazojć zpksoft apertium slovnyk framenet cfd commons)
  • book 100 (pl af am ar ast az be bg blk bn br bs ca chr ckb co cs cy da de el en eo es et eu fa fi fj fr gd gl gv hi hr hu hy ia id ie io is it iu ja jv ka ko ks ku ky lmo lo lt lv mg mi mk ml mn mt my nds nl no oc om pt ro ru sa sg si simple sk sm sr sv sw ta te tg th tr ug uk ur uz vi wa zh zh-min-nan zu kazojć zpksoft apertium slovnyk framenet cfd commons)
  • tree 100 (pl af am an ar ast az blk bn br bs ca co cs cy da de el en eo es et eu fa fi fj fo fr ga gd gl hi hr hu hy id ie io is it iu ja kk ko ku kw ky li lmo lo lt lv mg mi mk mn my na nah nl no oc om pa pt ro ru scn sg si simple sk sm sq sr sv sw ta te tg th tk tl tpi tr uk ur uz vi wa za zh zh-min-nan zu kazojć zpksoft apertium slovnyk cfd commons)
  • apple 99 (pl af an ar ast az bg blk bn br bs ca chr ckb cs cy da de el en eo es et eu fi fj fo fr ga gl gv hi hu hy ia id io is it ja ka kk km ko ks ku kw ky lb lmo lo lt lv mg mi mk ml mn my nds nl no oc om pa pt ro roa-rup ru sg shn simple sk sm sv sw ta te tg th tl tr ug uk ur uz vi vo yue zh zh-min-nan zu kazojć zpksoft apertium slovnyk framenet cfd commons)
  • day 99 (pl af an ar ast ay az be bg blk bn br ca co cs cy da de el en eo es et eu fa fi fj fo fr fy ga gl hi hr hu hy id ie io is it ja kk km ko ks ku ky la lb lmo lo lt lv mg mi mk mnw my na nl no oc om pt ro roa-rup ru sa sg si simple sk sm sq sr sv sw ta te tg th tl tr uk ur uz vi wa za zh zh-min-nan kazojć zpksoft apertium slovnyk framenet cfd commons)

A dla polskiego tak:

1-10[edytuj]

  • woda 55 (pl an ast az be ca chr cs csb cy de dv el en eo es et eu fa fi fr fy gv hr hu io is it ja ku ky la li lt lv mn na nah nl oc pt ru sk so sv ta tg th tl tr ug uz zh zh-min-nan commons)
  • poniedziałek 48 (pl af ar ast az be bs ca cs csb cy da de el en eo es et eu fi fr fy gl hr hu hy io is it ja ky li lt lv mg mn nl oc pt ro ru sl sv ta tr uk zh-min-nan commons)
  • ptak 48 (pl an az be ca chr cs csb cy da de dv el en eo es et eu fi fr hr hu io is it ja ko ku la li lt mg mn nah nl ro ru si sk sm sv sw ta th tr ug zh commons)
  • język 46 (pl ast az bs ca chr cs de el en eo et eu fa fi fr hr hu io is it ja ko ky li lt mk mn na nds nl oc pt ru sg sk sl sm sv ta tg th tr zh zh-min-nan commons)
  • miłość 46 (pl af ar ast az bg bs ca chr co cs cy da de el en eo es et eu fi fr gl hr hu is it ja ku ky la lt lv mg nl pt ro ru scn sm sv ta th tr zh commons)
  • czwartek 45 (pl ar ast az bs cs cy da de el en eo es et eu fi fr gl hr hu hy io is it ja kl km ky li lt mn nl oc pt ro ru sl sv sw ta tr tt uk zh commons)
  • sobota 45 (pl ang ar ast az bs cs cy da de el en eo es et eu fi fr gl hr hu hy is it ja ky lt lv mg mn nl no oc pt ro ru sk sl sv ta tr uk uz zh commons)
  • wtorek 45 (pl ar ast az bs cs csb cy da de el en eo es et eu fi fr gl hr hu hy io is it ja kl ky la li lt mn nl oc pt ro ru sl sv ta tr uk zh zh-min-nan commons)
  • cukier 44 (pl az bs chr cs cy de el en eo es eu fa fi fr gl hu io it ja ko ku ky li lt lv mk nl oc pt ro ru sl sm sv ta th tl tr tt uz vi zh commons)
  • jabłko 43 (pl az bs ca chr cs cy da el en eo et eu fa fi fr hr hu io it ja ko ku ky li lt lv mg mn nl no oc pt ru sl sv ta tg th tl tr zh commons)

Jeszcze tu są ciekawe listy frekwencyjne i to na wolnej licencji, ale nieststy formy odnmienione liczone są jako osobne słowa: https://github.com/unicode-org/unilex/tree/main Olaf (dyskusja) 09:40, 30 mar 2024 (CET)[odpowiedz]