For faster navigation, this Iframe is preloading the Wikiwand page for Wikipedysta:Lb.at.wiki/Kategorie tematyczne.

Wikipedysta:Lb.at.wiki/Kategorie tematyczne

Patrzysz obecnie na II wersję artykułu. W przyszłości może ulegać on dalszym modyfikacjom.
Ta strona w pigułce: Bardzo dobrze, że czytelnik może dojść do artykułu o Mehmecie Ali Ağcy wiedząc tylko, że istnieje jakiś związek między nim a którymś z Papieży.

Stosunkowo niedawno powstał bardzo użyteczny Wikiprojekt:Kategoryzacja. Ma on za zadanie utrzymanie porządku w istniejącej sieci powiązań między artykułami na Wikipedii. Aby móc produktywnie rozwijać ten aspekt Projektu należy wpierw zadać sobie pytanie, do czemu właściwie służy samo drzewo kategorii.

W wyniku zażartych dyskusji na ten temat ukazał się tekst pt. Wikipedia:Kategorie tematyczne. Są w nim zawarte propozycje uporządkowania struktury drzewa tak, aby między hasłami nie było połączeń prowadzących do dziedzin niezwiązanych zupełnie z pierwotnym tematem. Służyć temu ma m.in. podział kategorii na "tematyczne" i "obiektowe".

Moim zdaniem obrany kierunek prac zupełnie mija się z celem funkcjonowania drzewa kategorii i w przyszłości odbić się na jakości samej witryny. Treść wspomnianego artykułu wprowadza bardzo dużo zamieszania przez niejasne definicje wyprowadzanych pojęć. Zawarte tam instrukcje prowadzą do fragmentaryzacji sieci połączeń, wprowadzenia nowych, karkołomnych obowiązków dla redaktorów i w efekcie zwiększają ryzyko utraty cennych dla użytkowników informacji.

Szerszy wymiar naszych działań

[edytuj | edytuj kod]

Najpierw przytoczę szereg założeń, na których się opieram, przeprowadzając krytykę tzw. "kategorii tematycznych". Jestem przekonany, że z poniższymi tezami może się identyfikować całkiem liczna grupa twórców Projektu.

  1. Wikipedia powinna być użyteczna. Ma służyć przede wszystkim czytelnikom, a nie stanowić realizację ambicji jej redaktorów. Wiem, że brzmi to idealistycznie. Nie daj się jednak zwieść pozorom, taki pogląd dyktuje czysty pragmatyzm. Zmieniając kolejność tych priorytetów skazujemy się na walkę poszczególnych grup interesów i chaos organizacyjny.
  2. Jej obsługa powinna być prosta i zrozumiała dla każdego gościa. Każdy przypadkowy czytelnik powinien móc łatwo i szybko dodać coś od siebie. Jego wkład powinien być natychmiast skuteczny, tzn. nie potrzebować poprawek ze strony redaktorów.
  3. Twór tworzony bezinteresownie i z konkretnej potrzeby ma tendencję do przybierania formy najwygodniejszej dla większości użytkowników (taki ekwiwalent II zasady termodynamiki...). Jeżeli uważamy, że dzieje się z nim coś złego, musimy wpierw udowodnić słuszność naszych przekonań (tzn. wykazać, że większość na traci tego z powodu). Później zabieramy się do przekształcania go na własną modłę.
  4. Wikipedia jest strukturą nie do ogarnięcia dla małej grupki osób, choćby posiadali znakomite kwalifikacje. Należy zachować wobec niej pokorę. Często sterowanie istniejącymi tendencjami jest lepsze niż sztuczne kreowanie nowych.
  5. Wikipedia:Ignoruj wszystkie zasady – przyzwolenie na konstruktywną krytykę jest wpisane w etos naszej pracy :)

Dwa poglądy na drzewo kategorii

[edytuj | edytuj kod]

Obecna struktura katalogu opiera się na prostych zasadach:

  • Kategorie są uszeregowane od najbardziej ogólnych do najbardziej szczegółowych .
  • Wśród powiązanych kategorii nie wolno tworzyć pętli wzajemnych odwołań .
  • Artykuł posiada kategorię, które najlepiej go opisują.
  • Każda kategoria wnosi do artykułu dodatkowe informacje.

W efekcie stosowanie tego algorytmu (intuicyjnie zrozumiałego dla każdego użytkownika) prowadzi do stworzenia grafu skierowanego, który odpowiada pełnemu drzewu naszej wiedzy. Jego kształt nie został arbitralnie narzucony przez wąską grupę ekspertów, ale powstaje oddolnie, według bieżących potrzeb. W efekcie nie jest on sztywną pionową strukturą, ale czymś w rodzaju wielowymiarowej mapy relacji. Pomimo dużej ilości równoległych połączeń, zmierza w kierunku coraz większej szczegółowości.

W przeciwieństwie do niego tzw. kategorie tematyczne opierają się na niejasno opisanych założeniach. Z wypowiedzi pomysłodawców można wyciągnąć następujące wnioski:

  • Zasada wyłączności "kategorii tematycznych" powoduje, że nie są one kompatybilne z pozostałą częścią katalogu. Do tej pory działaliśmy na zasadzie kreatywnego łączenia treści, teraz duży fragment drzewa mamy utrzymywać zupełnie oddzielnie.
  • Wiele haseł będzie dwukrotnie skategoryzowanych. Dwa osobne klucze klasyfikacji ("tematyczny" i "obiektowy") wymagają odwoływania się do każdym z nich osobno. To dublowanie pracy i piętrzenie trudności przed mniej zorientowanymi edytorami.
  • "Kategorie obiektowe" można i tak podpinać pod "kategorie tematyczne". Z tego powodu na niższych partiach drzewa gromadzą się zupełnie niezwiązane ze sobą artykuły. Niweczy to główne założenie wnioskodawców, mianowicie całkowite wyrugowanie takich połączeń.
  • Każdy uczestnik musi dogłębnie opanować całą strukturę katalogu, aby nie dodawać haseł, które nie mają bezpośredniego związku z kategoriami wyższego rzędu.
  • Zubożona zostanie sieć połączeń między artykułami. Czytelnik może mieć poważne trudności z dotarciem do interesujących go kwestii.
  • Obecnie (w sprzeczności nawet z w/w regułami) przerywa się całe łańcuchy kategorii, przez co hasła przestają być widoczne dla obsługujących je wikiprojektów.

Taki kierunek działań niesie za sobą liczne zagrożenia. Tracimy czas na odgórne planowanie całkowicie sztucznej struktury. Antagonizujemy wobec siebie społeczność Wikipedystów (roztrząsając przynależność mało istotnych podkategorii) oraz użytkowników zewnętrznych (kto z nich odważyłby się dodać cokolwiek do tak skomplikowanego tworu?). Ostatecznie, wprowadzając chaos sztucznymi rozgraniczeniami, przyczyniamy się do naruszenia stabilności całego systemu danych. To musi skończyć się dużym nieporozumieniem. Żadna inna wersja językowa nie zdobyła się dotąd na taką ekstrawagancję.

Wygląd obecnego systemu

[edytuj | edytuj kod]

Chociaż skomplikowany zbiór relacji, łączący między sobą poszczególne hasła, bywa nazywany "katalogiem", czytelnik rzadko posługuje się nim w tradycyjny sposób, tj. aby przejść od zagadnienia ogólnego do szczegółowego hasła. W odmiennych okolicznościach wprowadzanie "kategorii tematycznych" miałoby przynajmniej jakieś uzasadnienie, analogicznie do "katalogu przedmiotowego" typowej biblioteki. Musimy mieć świadomość, że ok. 70% przejść do artykułów odbywa się z poziomu wyszukiwarki internetowej! Kategorie są produktem wtórnym i służą w większości do poszerzania obszaru poszukiwań.

Wiele nieporozumień wynika z trudności w wizualizacji takiej rozbudowanej struktury. W znacznej mierze sugerujemy się własnym doświadczeniem oraz obrazami generowanymi przez aplet CatGraph. Dla pojedynczego hasła rysuje on graf przypominający typowe drzewo (przykład). Jednak haseł mamy setki tysięcy – co z tego wynika? Otóż idąc od góry tego drzewa niejednokrotnie mamy do wyboru kilkanaście możliwości (analogiczny przykład). Ilość kategorii rosłaby wykładniczo z każdym krokiem, gdyby nie fakt, że wiele z nich odwołuję się do siebie nawzajem. Łącznie tworzy to gęstą sieć połączeń, rodzaj mapy semantycznej, za pomocą której potrafimy scharakteryzować każdy dodawany do Wikipedii termin.

Młody naukowiec z Carnegie Mellon University, Chris Harrison, próbował zwizualizować ogrom naszej bazy danych. Jego próby bardziej adekwatnie odzwierciedlają układ drzewa kategorii. Już pobieżne spojrzenie uświadamia nam, że drzewo kategorii jest w istocie misterną mozaiką połączeń. Kilka etykiet wysokiego rzędu ("Ludzie", "Medycyna", czy "Historia") szybko zostaje rozbitych na setki bardziej szczegółowych, które odwołują się do siebie nawzajem. Czytelnicy większość czasu skaczą po obrzeżach okręgu, nie bardzo zdając sobie sprawę z formalnego porządku kategorii dla poszczególnych haseł (ukazywanym w Catgraphie).

Podkreślę ponownie: swoboda w eksploracji treści przez czytelnika jest ważniejsza niż teoretyczny układ drzewa kategorii. Kategorie en:wiki prezentują często jeszcze większy bałagan pojęciowy, a w praktyce sprawdzają się pod tym względem znakomicie. Czytelnik korzysta naprzemiennie z łączy zawartych w artykułach, szablonach, sekcjach "Zobacz też" i kategoriach. Harrison spróbował oddać i tą skomplikowaną sieć relacji. Dla użytkownika przede wszystkim liczy się rzetelność połączeń krótkiego zasięgu, a nie globalna struktura linków, która faktycznie układają się w gigantyczną pajęczynę.

Korzyści z obecnego systemu

[edytuj | edytuj kod]

Dlaczego obecne drzewo kategorii, rozwijane w zbliżony sposób na każdej wersji językowej Wikipedii, spełnia swoją rolę tak efektywnie? Moim zdaniem sprzyjają temu następujące okoliczności:

  1. Struktura sieci rozproszonej: do każdego węzła można się zwykle dostać z kilku innych miejsc sieci. Gwarantuje to stabilność i bezpieczeństwo pracy, ponieważ przypadkowe (lub celowe) uszkodzenie jednego punktu nie odbija się mocno na jej ogólnej wydajności.
  2. Wielowątkowość: Czytelnicy (jak i redaktorzy) pochodzą z wielu środowisk, wyznają różne wartości, postrzegają świat na różne sposoby. Drzewo kategorii obecnie można przeglądać swobodnie w obu kierunkach. Szukając informacji o środku przeciwbólowym, ktoś może być zainteresowany jego składem chemicznym, wpływie na percepcję bólu, wartością leczniczą albo chcieć po prostu zapoznać się z polecanymi artykułami lub tymi, które wymagają dopracowania. Jak zamierzamy ustalić, która z tych pobudek jest najwłaściwsza?
  3. Wsparcie dla kreatywnego myślenia: system kategorii ma w sobie coś z sieci neuronowej, wielowątkowego sposobu przetwarzania sygnałów o wysokim poziomie złożoności. Mózg człowieka również funkcjonuje na zasadzie łączenia luźnych skojarzeń, łącząc poszczególne elementy w całość bez względu na formalne relacje między nimi. Zastanawiając się, jak nazywało się ciastko, które jadał w Wadowicach młody Karol Wojtyła, poruszamy się (w myślach) zupełnie swobodnie między kategoriami "Zwierzchnicy Kościoła Katolickiego" --> "Miasta województwa małopolskiego" --> "Ciastka z kremem". Kategorie Wikipedii stanowią dobrą wizualizację tego procesu.
  4. Łatwość analizy: graf skierowany jest strukturą dość przyjazną informatykom. Dzięki odpowiednim skryptom Wikipedyści związani z różnymi projektami mogą kontrolować stan haseł, na którym im zależy. Catscan, Catgraph, TreeViews ułatwiają efektywne zarządzanie treścią encyklopedii. Jest oczywiste, że część artykułów mieści się w obszarze zainteresowań różnych projektów, np. o Marii Skłodowskiej mieliby coś do powiedzenia zarówno fizycy, historycy, jak i np. feministki. Dzięki licznym rozgałęzieniom drzewa kategorii mogą oni monitorować hasła, które w sposób nieoczywisty wiążą się z ich specjalnością (a jest na nie zapotrzebowanie) lub są tak specjalistyczne, że patrolując tylko główne tematy można by je łatwo pominąć.
  5. Łatwość obsługi: proste reguły katalogowania umożliwiają włączenie się w tę (często żmudną) pracę większej ilości osób. Nawet "z doskoku" można szybko wnieść jakiś wartościowy wkład.
  6. Łatwość współpracy: prostota obsługi przekłada się na mniejszą ilość kłótni, sporów, przestojów w pracy. Na Wikipedii najważniejsza jest w końcu treść haseł, a nie formalne relacje między nimi.

Wnioski

[edytuj | edytuj kod]

Przedstawiam kilka kluczowych wniosków:

  • Obecna struktura drzewa kategorii powinna być zachowana
  • Kategorie tematyczne są pomysłem szkodliwym i powinny zostać ponownie włączone do reszty katalogu
  • Jeżeli nadal są chętni do rozwijania tego typu pomysłów, to powinni je prowadzić osobno, nie zakłócając pracy przy reszcie projektu
  • Uważam, że możemy być dumni z obecnej metody klasyfikacji haseł :)

W sprawach technicznych Wikipedii jestem laikiem, ale uważam, że przy odrobinie sprytu wiele celów Wikiprojektu Kategoryzacyjnego można osiągnąć za pomocą zaimplementowanych obecnie mechanizmów.

  1. Do grupowania haseł według jednego klucza, bez podpinania wszystkich artykułów im podlegających, służą listy artykułów. Zamiast "kategorii tematycznych" twórzcie listy pierwiastków chemicznych, miast w Polsce, czy organicznych związków chemicznych z grupą -OH. Zarządzanie takim czymś z poziomu bota również nie przysparzałoby nikomu wiele trudności. Przekształcenia pasożytniczego drzewa wspomnianych kategorii w elegancką listę można dokonać np. za pomocą takiego skryptu.
  2. Tematyka danej kategorii jest definiowana niejako przez artykuł główny tej kategorii. Jeżeli czytelnik nie wie, co dana kategoria porządkuje, powinien się z nim zapoznać w pierwszej kolejności.
  3. Innym sposobem zaznaczaniem czyjegoś zwierzchnictwa nad hasłem jest wstawienie szablonu danego wikiprojektu (tak, jak jest to praktykowane na stronach dyskusji en:wiki). Wiem, że to rozwiązanie kontrowersyjne, ale wykazuje dużą skuteczność. Członkom WP:CHEM takich rzeczy tłumaczyć nie trzeba ;)
  4. Szablony nawigacyjne również zbierają w jedną całość artykuły, tym razem pozostające wobec siebie w jasnym związku. Czemu nie odwoływać się do nich, patrolując jakąś dziedzinę? Nie tylko ich zawartość ułatwia porządki, ale sama ich obecność na stronie jest właśnie takim poszukiwaną formą tagów. Zlecamy botowi, aby zwrócił wszystkie hasła posiadające szablony nawigacyjne z danego zakresu, do tego infoboxy, znaczki stubów, itp. i już posiadamy prawie całą dziedzinę w garści.

Z powyższych rozważań płynie następujący wniosek: to nie system kategorii na Wikipedii jest niedoskonały, tylko nasze narzędzia, za pomocą których go monitorujemy! Może trzeba zmodyfikować algorytmy? Może trzeba precyzyjniej określać parametry początkowe? Zastosować bardziej skomplikowane warunki logiczne w celu eliminacji niechcianych gałęzi drzewa kategorii? Ostatecznie do każdego celu wiedzie wiele alternatywnych ścieżek. Nie niszczmy więc czegoś, co do końca nie jesteśmy w stanie pojąć.

{{bottomLinkPreText}} {{bottomLinkText}}
Wikipedysta:Lb.at.wiki/Kategorie tematyczne
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?