Wikisłownik:Automatyczne generowanie odmiany

Z Wikisłownika – wolnego słownika wielojęzycznego
Przejdź do nawigacji Przejdź do wyszukiwania

Część odmiany na Wikisłowniku jest wygenerowana automatycznie, a następnie sprawdzona przez człowieka. Proces wygląda następująco:

1. Program (fragment kodu Olafbota) pobiera alfabetyczną listę odmienionych form danego słowa ze słownika sjp.pl na licencjach GPL oraz CC-SA, np. dla słowa londyńczyk:

londyńczyk, londyńczycy, londyńczyka, londyńczykach, londyńczykami, londyńczyki, londyńczykiem, londyńczykom, londyńczykowi, londyńczyków, londyńczyku

Jeśli słowa nie ma w sjp.pl, hasło jest wpisywane na listę "do sprawdzenia".

2. Odcinany jest temat wspólny dla wszystkich form (w tym przypadku londyńczy):

~k, ~cy, ~ka, ~kach, ~kami, ~ki, ~kiem, ~kom, ~kowi, ~ków, ~ku

W specjalny sposób są traktowane słowa zakończone na -zm oraz rzeczowniki odczasownikowe, które są rozpoznawane na podstawie końcówki a nie odmiany z sjp.pl.

3. Na liście wzorców odmiany poszukiwany jest odpowiedni wzorzec i pobierany jest dla niego tekst we właściwym dla Wikisłownika formacie:

{{lp}} Q|k, ~ka, ~kowi, ~ka, ~kiem, ~ku, ~ku; {{lm}} ~cy, ~ków, ~kom, ~ków, ~kami, ~kach, ~cy

Jeśli taki tekst się nie znajdzie, odmiana nie jest generowana, a hasło jest wpisywane na listę "do sprawdzenia".

4. Na liście wzorców mogą wystąpić symbole: Q oznaczające temat oraz Q1, oznaczający temat bez ostatniej litery. Wszystkie ich wystąpienia są zastępowane przez odpowiedni fragment badanego słowa:

{{lp}} londyńczy|k, ~ka, ~kowi, ~ka, ~kiem, ~ku, ~ku; {{lm}} ~cy, ~ków, ~kom, ~ków, ~kami, ~kach, ~cy

5. Wygenerowana odmiana jest porównywana z ewentualną istniejącą odmianą z hasła. Bot potrafi przy tym rozpoznać różne zapisy tej samej odmiany, np. zapis:

londyń|czyk ~czyka, ~czykowi, ~czyka, ~czykiem, ~czyku, ~czyku, ~czycy, ~czyków, ~czykom, ~czyków, ~czykami, ~czykach, ~czycy

zostanie uznany za identyczny z powyższym, gdyż generuje taką samą odmianę.

6. Jeśli w haśle nie było odmiany, lub się istotnie różniła, propozycja bota jest wstawiana na końcu sekcji {{odmiana}}, ukryta w szablonie {{niesprawdzona odmiana}}, który ją ukrywa przed czytelnikami. Jest też dodawany tekst w komentarzu HTML-owym, informujący o pierwszej napotkanej różnicy (np. <!-- abcugg→abcug -->). Jeśli odmiana była, i różni się jedynie zapisem, hasło trafia na listę "inny zapis". Jeśli zapis odmiany niczym się nie różni, bot pomija dane hasło.

7. Wygenerowana odmiana jest sprawdzana przez człowieka. Listę haseł do sprawdzenia można znaleźć tutaj. Człowiek weryfikuje i poprawia odmianę bezpośrednio w hasłach, zdejmując szablon {{niesprawdzona odmiana}} i ewentualnie dodając rodzaj. Sprawdzenie jest konieczne gdyż:

  • nie da się na podstawie alfabetycznej listy form odróżnić rodzaju męskorzeczowego i męskożywotnego/męskoosobowego. Ich odmiana jednak różni się tym, że w męskożywotnym i męskoosobowym B.=D.(np. Widzę psa; Widzę człowieka), a w męskorzeczowym B.=M. (np. Widzę kamień). Zdarzają się także słowa posiadające różne rodzaje w zależności od znaczenia (np. Widzę strach w twoich oczach ale Widzę stracha na wróble.).
  • Słownik sjp.pl dopuszcza formy potencjalne, np. lm geografie, które nie są dopuszczalne na Wikisłowniku.
  • Słownik sjp.pl dopuszcza formy deprecjatywne, np. londyńczyki w przykładzie powyżej, także nie stosowane na Wikisłowniku.
  • Dla większości wzorców odmiany, deklinacja przymiotnika nie determinuje jego stopniowania, które jest w Wikisłowniku zaznaczane w polu {{odmiana}}