Wikisłownik:Zadania dla botów/Archiwum/2020

Z Wikisłownika – wolnego słownika wielojęzycznego

Zbędne dwukropki[edytuj]

Następujące szablony: {{on}}, {{kun}}, {{nanori}} mają już zakodowany dwukropek, który wyświetla się automatycznie. Mimo to w niektórych hasłach japońskich stoi po nich dodatkowo dwukropek w kodzie strony, co skutkuje wyświetlaniem dwóch dwukropków. Czy jakiś bot mógłby pousuwać dwukropki stojące bezpośrednio po tych szablonach w hasłach japońskich, w polu „czytania”? W innych miejscach szablony te nie powinny występować, a nawet jeśli, to chyba dwukropek też jest zbędny, ale pewności nie mam. Maitake (dyskusja) 13:31, 2 wrz 2020 (CEST)

@Maitake: wyszły mi łącznie 202 hasła, które niebawem przebotuję. W międzyczasie: w hasłach 岩#ja oraz 髪#ja mamy puste nanori; w hasłach 岩#ja 神#ja, 雷#ja, 塚#ja, 営#ja oraz 十七#ja wspomniane szablony występują także w innych polach. Peter Bowman (dyskusja) 14:09, 2 wrz 2020 (CEST)
Skoro już przy tym jesteśmy – zauważyłem, że czasem grupy czytań on'yomi, kun'yomi, nanori są oddzielane przecinkami, czasem nie. Chodzi mi o pogrubiony przecinek w poniższym wierszu:
{{on}} シ (shi), サイ (sai), {{kun}} ふる.う (furu.u)
W w/w kolekcji ok. 200 haseł tych pierwszych jest dwa razy więcej. Mogę przy okazji ujednolicić wygląd – przecinek wszędzie dodać, usunąć albo zamienić np. na średnik (i opisać później w dokumentacji szablonów). Peter Bowman (dyskusja) 14:25, 2 wrz 2020 (CEST)
  • Dziękuję bardzo. Wydaje mi się, że jakiś znak pomiędzy poszczególnymi rodzajami czytań byłby sensowny, bo jeśli jest pomiędzy poszczególnymi czytaniami w obrębie jednego typu (przecinek), to powinien być też pomiędzy typami – chyba lepiej, żeby to był średnik (choć w kilku sam wstawiłem przecinek). — Wymienionymi powyżej hasłami, w których te szablony występują w polach innych niż „czytania”, zaraz się zajmę. Pozdrawiam, Maitake (dyskusja) 15:22, 2 wrz 2020 (CEST)
  • Dziękuję. Usunąłem botem wszystkie dwukropki (ostatecznie wyszło 201 haseł), zadanie oznaczam jako wykonane. Sądzę, że co do średników nie ma pośpiechu – na wszelki wypadek jeszcze trochę poczekam i najwcześniej za tydzień lub dwa przebotuję wszystkie czytania (ok. 600 stron), jeżeli nie będzie sprzeciwu. Pozdrawiam, Peter Bowman (dyskusja) 16:55, 2 wrz 2020 (CEST)
  • @Peter Bowman: Poprawiłem wszystkie wymienione wyżej hasła. Jedynie w haśle 岩#ja (wymieniony w drugiej serii jako pierwszy) nie znalazłem żadnego szablonu w polu innym niż „czytania” – czy to jakaś pomyłka? Chodziło o inny znak? Było puste nanori, co poprawiłem, ale w innych polach nie znalazłem. Pozdrawiam, Maitake (dyskusja) 19:38, 2 wrz 2020 (CEST)
  • @Maitake: przepraszam, to moja pomyłka przy kopiowaniu znaków, hasło miało być wyłącznie w pierwszej serii. Dziękuję za pomoc i pozdrawiam, Peter Bowman (dyskusja) 20:28, 2 wrz 2020 (CEST)
  • To ja dziękuję bardzo. I na wszelki wypadek oznaczam jeszcze raz jako Załatwione. Pozdrawiam, Maitake (dyskusja) 20:36, 2 wrz 2020 (CEST)

Znaczenia ukraińskie bez źródeł[edytuj]

Chciałbym w miarę możliwości uźródłowić wszystkie znaczenia w ukraińskich hasłach. Mam odpowiednie źródła. Potrzebowałbym listę ukraińskich haseł, w których jest znaczenie, w którym jest wiersz, w którym brak jest wywołania któregokolwiek z szablonów znajdujących się w kategorii Kategoria:Szablony źródeł (ukraiński). Lista szablonów w tej kategorii będzie się zmieniała, bo właśnie zamówiłem kolejne słowniki na Ukrainie, więc dobrze by było gdyby bot zaczytywał tę listę dynamicznie w razie kolejnych przebiegów. W liście wystarczy mi tylko link do hasła bez źródła. Jeśli to możliwe to prosiłbym żeby na liście hasła były podzielone w sekcje po 10 sztuk. Czy jest to możliwe. Do ustalenia jest czy po przerobieniu mam hasła z listy usuwać ręcznie czy też bot będzie w miarę często listę aktualizował i sam usuwał zrobione, dostosuję się. Mam nadzieję, że nie jest to zbyt trudne. :) KaMan (dyskusja) 07:48, 22 paź 2020 (CEST)

@KaMan, ograniczyłem listę, bo jest tego trochę dużo: Wikisłownikarz:PBbot/nieuźródłowione hasła ukraińskie. Obecnie automat jest ustawiony na odświeżanie listy codziennie w nocy, o ile wykonano jakieś zmiany w hasłach. Czy taki tryb jest odpowiedni? Peter Bowman (dyskusja) 13:56, 22 paź 2020 (CEST)
@Peter Bowman Jest idealnie. :) Pięknie dziękuję! KaMan (dyskusja) 14:06, 22 paź 2020 (CEST)
@Peter Bowman Mały ale dokuczliwy drobiazg. Hasło Алжир trafiło do zestawienia chociaż oba znaczenia mają źródło. Problem w tym, że drugie znaczenie refuje z parametrem name do źródła z pierwszego znaczenia, więc nie ma wywołania szablonu, ale jest poprawnie uźródłowione. Takich przypadków będzie wiele, sam chyba 3 takie hasła dzisiaj utworzyłem. Czy widzisz jakieś proste rozwiązanie by takie hasło nie trafiało do zestawienia? KaMan (dyskusja) 16:18, 22 paź 2020 (CEST)
@KaMan: uwzględniłem ten niuans, ale bot utknął przy braku cudzysłowów wokół nazwy atrybutu. Ciąg <ref name=uk/> zinterpretował jako <ref name="uk/"></ref> zamiast <ref name="uk"></ref>, dlatego nie udało mu się podporządkować drugiego przypisu. Teraz powinno być dobrze: Specjalna:Diff/7447154. Peter Bowman (dyskusja) 17:27, 22 paź 2020 (CEST)
@Peter Bowman Dziękuję. Ale rodzi mi się pytanie, czy parametr do ref bez cudzysłowów jest na 100% ok? Nie ukrywam, że sam stosuję takie rozwiązanie bo to o dwa przypadki naciśnięcia shifta mniej niż potrzeba (każda kombinacja z dwoma klawiszami jest kłopotem dla szybkich palców). Czy nie warto by jakiś bot te cudzysłowy uzupełniał? KaMan (dyskusja) 06:05, 23 paź 2020 (CEST)
@KaMan: brak cudzysłowów (prostych lub podwójnych) jest w zgodzie ze specyfikacją HTML5, ewentualnie zawiniła implementacja parsera HTML, z którego korzystam ([1]). Właściwie problem rodzi się z użycia samozamykającego znacznika <ref/>, który jest jak najbardziej w porządku w projektach wiki. W swoich starych skryptach znalazłem komentarz, jakoby wstawienie spacji zaraz przed zamykającym /> miało uchronić przed niewłaściwą interpretacją. Tak czy inaczej, obecny kod już sobie z tym dobrze radzi i nie musisz niczego zmieniać :). Tym samym uzupełnianie cudzysłowów botem miałoby charakter zmiany kosmetycznej, toteż nie ma sensu uruchamianie automatu tylko w tym celu. Peter Bowman (dyskusja) 11:24, 23 paź 2020 (CEST)

Załatwione. Peter Bowman (dyskusja) 20:26, 15 maj 2022 (CEST)

Wyłapanie zdublowanych przypisów[edytuj]

Przez przypadek przeglądając edycje Olafbota na hasłach ukraińskich wyłapałem przypadek gdy użyłem drugi raz tego samego przypisu w obrębie jednej sekcji. Poprawiłem, ale zastanowiło mnie czy nie ma takich przypadków więcej, dlatego proszę o zestawienie sytuacji gdy w obrębie jednej sekcji językowej dwukrotnie lub więcej występuje ten sam przypis z tymi samymi parametrami w szablonie źródła (ale jeśli to możliwe rozpoznając sytuację gdy parametry szablonu źródła są w różnej kolejności). KaMan (dyskusja) 04:42, 23 lis 2020 (CET)

@KaMan: wygenerowałem Wikisłownikarz:PBbot/zdublowane przypisy, znalazło 550 wyników. Uwaga: dwa znaczniki <ref> wyświetlają się:
  • jako dwa osobne przypisy – mimo że treść jest identyczna – gdy mają różny atrybut name (albo kiedy go brak);
  • jako jeden i ten sam przypis, kiedy atrybut name oraz treść są identyczne (przykład);
  • z błędem, kiedy mają ten sam atrybut name, lecz ich treść czymś się różni.
Obecnie lista uwzględnia pierwszy oraz drugi przypadek, choć tego drugiego może jednak nie powinna. Zbadam możliwość przebotowania wystąpień. Pozdrawiam, Peter Bowman (dyskusja) 23:25, 9 mar 2021 (CET)
@Peter Bowman Pięknie dziękuję za wykonaną pracę! O tak, jeśli jest 550 wystąpień to przydałoby się rozwiązanie tego botem, chociaż jeśli się nie da to ukraińskich przypadków na liście jest stosunkowo mało, mogę ogarnąć je ręcznie jeśli nie starczy czasu na bota. KaMan (dyskusja) 02:54, 10 mar 2021 (CET)
@KaMan: właśnie przebotowałem listę. Pozdrawiam, Peter Bowman (dyskusja) 00:39, 14 mar 2021 (CET)

Załatwione. Peter Bowman (dyskusja) 20:26, 15 maj 2022 (CEST)

Ukraińskie hasła bez żadnego nagrania wymowy[edytuj]

Chciałbym poprosić osobę, która obecnie dostarcza mnóstwo nagrań wymowy dla ukraińskiego (jak wynika z edycji OlafBota) o nagrania do naszych haseł. W tym celu przydałaby się lista haseł bez żadnego nagrania wymowy żeby ta osoba mogła skupić się wyłącznie na brakach. W sumie może być to zadanie cykliczne żeby ta osoba mogła mieć codziennie odświeżoną listę. KaMan (dyskusja) 12:12, 28 lis 2020 (CET)

@KaMan: wrzuciłem listę tutaj. Będzie generowana z każdym zrzutem bazy danych (średnio dwa razy w miesiącu, zob. datę powstania pliku), ale w razie potrzeby ustawię częściej. Pozdrawiam, Peter Bowman (dyskusja) 01:26, 29 lis 2020 (CET)
@Peter Bowman Pięknie dziękuję! Czy mam rozumieć, że lista odzwierciedla stan na 20 listopada czyli na dzień ostatniego zrzutu z bazy? Czy na 29 listopada czyli dzień wykonania listy? Chciałbym to dobrze wyjaśnić adresatowi. KaMan (dyskusja) 04:00, 29 lis 2020 (CET)
@KaMan: fakt, chodzi o dzień ostatniego zrzutu (20/11), przepraszam za niejasność. Bot teraz wstawia nazwę pliku (z datą) na początku listy. Peter Bowman (dyskusja) 12:14, 29 lis 2020 (CET)

@Peter Bowman @Olaf Jeden z ukraińskich autorów nagrań obiecał zająć się w grudniu naszymi brakami. Zauważyłem że bot Olafa dodaje nagrania tylko wtedy gdy wykona się w haśle jakąś edycję. Np. hasło абсолютно чорне тіло ma nagranie w tym wkładzie ale utworzone później niż hasło było edytowane. Czy w tej chwili jakikolwiek bot przegląda nagrania na Commons w poszukiwaniu nagrań do wstawienia niezależnie od wykonywanych przez nas edycji? KaMan (dyskusja) 13:00, 6 gru 2020 (CET)

Ja nie kojarzę, ale wspomniałem jeszcze Alkamidowi o tym wątku. Najprościej, by wymowę wstawiał w hasłach pojedynczy automat (Olafbot); dwójka mogłaby wchodzić sobie w drogę. Jeżeli Olafbot nie ma możliwości okresowego (tak co parę tygodni, mając na myśli zrzuty bazy danych) analizowania całej przestrzeni nazw albo jest to niewydajne, mógłbym zaprząc swojego bota do tej roboty, generując przefiltrowaną listę haseł dla późniejszej analizy przez bota Olafa. Chodziłoby o to, że miałby do przeskanowania ułamek tego, co wynikałoby z wczytania całego zrzutu z 800k+ stron. Peter Bowman (dyskusja) 13:57, 6 gru 2020 (CET)
To nie do końca jest tak, Olafbot dodaje wymowę przy okazji przeglądania OZ, ale poza tym przegląda okresowo każde hasło w Wikisłowniku, tylko przejrzenie wszystkiego zajmuje mu chyba około trzech miesięcy. Więc kiedyś te nagrania powinny się pojawić. Olaf (dyskusja) 13:03, 11 gru 2020 (CET)
@Olaf okresowo, co trzy miesiące, przegląda wyłącznie pod kątem dodania audio, czy przegląda ogólnie pod kątem jakichkolwiek zmian jakie by normalnie dodał przy okazji przeglądania OZ? Bo przeglądam wszystkie poprawki jakie Olafbot robi po moich edycjach i mam wrażenie, że co jakiś czas przy okazji poprawia rzeczy starsze niż trzy miesiące, co wskazywałoby, że to przeglądanie cotrzymiesięczne może nie być takie pewne albo ma jakieś inne reguły. Nie mniej cotrzymiesięczne przeglądanie może być zbyt rzadkie bo może doprowadzić do sytuacji, że kilka osób będzie niepotrzebnie dublować wykonywanie nagrań do haseł, które już mają nagrania, tyle że nie wstawione. Hmmm, co tu począć… KaMan (dyskusja) 14:35, 11 gru 2020 (CET)
Przegląda tak jak OZ, to znaczy oprócz dodawania wymowy, gdyby coś było do poprawienia to też by poprawił, ale to się rzadko zdarza, bo takie rzeczy są zmieniane na bieżąco. Może się jednak zdarzyć, że coś zmienię w bocie, dodam mu nową regułę i wtedy przy okazji tego okresowego sprawdzania z wolna zmieni to i w starych artykułach. Niezależnie idzie dodawanie słów podobnych, bot uzupełnia lub usuwa je co tydzień w całym słowniku. Dodawanie pokrewnych może zajść gdy dane słowo zostało użyte jako pokrewne po edycji w innym haśle, to idzie własnym rytmem. Jeśli masz konkretny przypadek, co do którego są wątpliwości, daj znać. Nie pamiętam czy dokładnie wychodzą trzy miesiące, bot po prostu ma pewną liczbę artykułów, które co dzień dodatkowo sprawdza oprócz Ostatnich Zmian i tak sobie systematycznie cały słownik przegląda. Można przestawić go na większą liczbę, może dałoby się żeby sprawdzał wszystko w miesiąc. Ale to dużo nie da, a więcej już raczej się nie uda, to jest duży słownik, bot nie wyrobi się czasowo z tak dużą liczbą haseł. Najlepiej pewnie byłoby, żeby bot sprawdzał sobie jakie nowe nagrania się pojawiły na commons i przeglądał konkretnie te hasła. Postaram się w wolnej chwili to napisać, ale raczej nie za szybko, przepraszam. Olaf (dyskusja) 14:55, 11 gru 2020 (CET)
@Olaf np. w tej edycji bot usunął spację po szablonie uwagi i ona chyba była tam dużo dłużej niż 3 miesiące (chyba że źle czytam historię hasła). A..., może to szalony pomysł, ale czy byłoby możliwe abyś upublicznił kod bota i ja bym zapuszczał go raz w tygodniu tylko dla haseł ukraińskich? KaMan (dyskusja) 15:24, 11 gru 2020 (CET)
A, tak, są też zmiany bardzo mało istotne, które bot w ogóle robi tylko przy okazji czegoś większego - boty mają ograniczenie na liczbę edycji na minutę, usunięcie spacji z końca linii nic nie zmienia w wyglądzie strony, więc kiedyś uznałem (słusznie lub nie), że nie warto marnować na taką edycję czasu. Ale jak się znalazło coś innego do poprawienia, to usunął tę spację przy okazji. Olaf (dyskusja) 17:35, 11 gru 2020 (CET)
@KaMan Kazałem botowi codziennie, z wyjątkiem nocy gdy dodaje podobne, przeglądać wszystkie hasła dla których istnieje ukraińska wymowa na Commons, więc powinno to być zawsze aktualne. To jeszcze nie jest stan docelowy, powinien to robić dla wszystkich języków, ale trochę się boję, że nie wyrobi czasowo. Dodatkowo poprawiłem błąd - bot nie brał pod uwagę czarnej listy przy imporcie. W tej chwili są dwie: Wikisłownikarz:Olafbot/import wymowy/nieimportowane pliki, Wikisłownikarz:Olafbot/import wymowy/nieimportowani autorzy. Pozdrawiam, Olaf (dyskusja) 21:19, 11 gru 2020 (CET)
Aktualizacja, Olaf już dodał przeglądanie Commons dla wszystkich języków. KaMan (dyskusja) 13:40, 24 sty 2021 (CET)

Załatwione. Peter Bowman (dyskusja) 20:26, 15 maj 2022 (CEST)