Strategie wyszukiwawcze użytkowników internetowego podręcznika w postaci stron WWW. Zarys problematyki


W referacie przedstawiono wstępne wyniki badań pilotażowych nad strategiami informacyjno-wyszukiwawczymi użytkowników posługujących się hipermedialnym podręcznikiem pn. „Wirtualna historia książki i bibliotek”. Badania te są częścią eksperymentu związanego z wyszukiwaniem informacji w hipertekstowych systemach, jej percepcją oraz opracowaniem modelu podręcznika w formie hipermedialnej. W trakcie badań posługiwano się kilkoma metodami i technikami badawczymi, m.in. metodą eksperymentalną, analizy dokumentów, obserwacją, monitoringiem, kwestionariuszem ankiety i wywiadem. Badaniem objęci byli studenci pierwszego, drugiego i trzeciego roku studiów dziennych na kierunku bibliotekoznawstwa. Przyjęto cztery podstawowe kryteria szeregowania strategii wyszukiwawczych: wiedza o systemie, wiedza o dziedzinie, sposób nawigacji, stosowanie hiperłączy. Przedstawione wyniki będą poddane weryfikacji w trakcie dalszych badań.

Pojawienie się programów hipermedialnych oraz internetowej usługi WWW, otworzyło nowe możliwości uatrakcyjnienia zajęć dydaktycznych na wszystkich poziomach kształcenia, poszerzając przy tym problematykę badań nad wykorzystaniem i przystosowaniem hipermediów w edukacji oraz w przekazie informacji.

 Referat niniejszy prezentuje wstępne wyniki badań pilotażowych, których celem było zbadanie zachowań informacyjno-wyszukiwawczych użytkowników posługujących się umieszczonym w Internecie podręcznikiem pt. „Wirtualna historia książki i bibliotek”[1]. Podręcznik[2] ten jest projektem autorskim, przeznaczonym dla studentów bibliotekoznawstwa jako pomoc w samokształceniu i uzupełnianiu treści, którą zawierają wydawnictwa tradycyjne, wykorzystywane na zajęciach z przedmiotu historia książki, bibliotek i jej funkcji społecznej. Zaprojektowany został w postaci dokumentów HTML, z wykorzystaniem dużej ilości materiału ilustracyjnego oraz animacji według pomysłu piszącego te słowa. Podręcznik jest w trakcie rozbudowy w tworzeniu biorą udział także studenci interesujący się dziejami książki należący do Koła Bibliologów.

 Wspomniane wyżej badania pilotażowe są fazą początkową kompleksowych badań, składających się w ogólnym zarysie z trzech części, z których każda dotyczy osobnego problemu:

Część I. Badanie zachowań informacyjno-wyszukiwawczych użytkowników, w tym strategii wyszukiwawczych, modelowych zachowań oraz wpływu czynników charakteryzujących hipermedium (hipertekst, ilustracje, nieliniowy układ treści) na sposoby docierania do poszukiwanej informacji.

Część II. Efektywność hipermedialnego podręcznika (skryptu) utrwalonego w postaci nieliniowej w dydaktyce oraz samokształceniu, celem tego etapu będzie m.in. zbadanie wpływu nieliniowego układu treści na efektywność uczenia się.

Część III. Projektowanie hipermedialnych pomocy dydaktycznych w postaci stron WWW. Jej zadaniem będzie wyłonienie modelu podręcznika hipermedialnego dostępnego w Internecie na podstawie cech, takich jak: układ tekstu, kolorystyka, rodzaje i formy hiperłączy oraz metody strukturalizacji wiedzy.

Zadaniem podjętych badań pilotażowych, oprócz zebrania materiału do zasadniczego eksperymentu, było także określenie charakterystycznych strategii docierania do informacji umieszczonej w hierarchicznie uporządkowanym systemie, w którym zagadnienia ogólne powiązane zostały semantycznie ze szczegółowymi. Osiągnięcie powyższych celów pozwoli na określenie czynników decydujących o przyjęciu przez badanego określonego modelu wyszukiwania. Do celów badań należą również opinie studentów na temat podręcznika i jego przydatności do samokształcenia.

Przed rozpoczęciem eksperymentu przyjęto następujące hipotezy robocze:

Użytkownik mający słabą orientację w danej dziedzinie nie może efektywnie wykorzystać hipertekstowego modelu organizacji wiedzy jakim jest serwis WWW[3].

Nieznajomość systemu informacyjno-wyszukiwawczego (w tym przypadku systemu hipertekstowego) wpływa ujemnie na skuteczne wykorzystanie hiperłączy, wiążących ze sobą tematycznie powiązane dokumenty (strony WWW).

Użytkownik zaawansowany w posługiwaniu się hipermedialnymi programami oraz bazami danych, poszukuje informacji w układzie dokumentów hipertekstowych[4] głównie za pomocą wyszukiwarki.

Próbę badawczą stanowili losowo wybrani studenci roczników pierwszego, drugiego i trzeciego roku studiów dziennych w sumie, 35 osób (z czego: 13 – I rok, 12 – II rok i 10 – III rok).

Podstawowymi metodami badawczymi był eksperyment, obserwacja, metoda statystyczna, analiza dokumentów, ankieta i wywiad. Oprócz tego zastosowano kilka form monitoringu, którego zadaniem było zapisanie czynności użytkownika w trakcie sesji wyszukiwawczej, należały do nich: nagrania na taśmie wideo, zapis obrazu pojawiającego się na monitorze w postaci pliku AVI. Wykorzystano także aplikację „Historia skoków”, w którą wyposażona jest przeglądarka WWW - Netscape Navigator, tworzy ona listę stron odwiedzonych przez użytkownika z dodatkowymi parametrami, takimi jak tytuł strony, liczba odwiedzin oraz czas (godzina i minuty), w którym strona odwiedzona była po raz ostatni. Dodatkowym narzędziem była również statystyka zapytań kierowanych do wyszukiwarki umożliwiającej dotarcie do poszukiwanej strony. Badania prowadzone były w pracowni komputerowej wyposażonej w osiem stanowisk komputerowych połączonych w sieć z dostępem do Internetu.

Eksperyment podzielony był na trzy części, w pierwszej użytkownicy mieli znaleźć strony WWW zawierające odpowiedź na pytania dotyczące różnych zagadnień związanych z dziejami pisma, książki rękopiśmiennej oraz historią bibliotek. Przykłady problemów wyszukiwawczych zadawanych w trakcie eksperymentu:

Którego świętego i w trakcie jakiej czynności przedstawiono na jednej z iluminacji z Ewangeliarza z Rossano

Sulus jest odmianą pisma ....

Jakie znalezisko wpłynęło na rozwój nauki zw. egiptologią

W jaki sposób malowano kobiety na papirusach egipskich?

W którym roku powstał Psałterz Chludowa?

Dla kogo przeznaczona była tzw. waza dipylońska?

Uzyskane odpowiedzi lub jej brak zapisywali na specjalnie przygotowanych kartkach. W części drugiej wypełniali kwestionariusz anonimowej ankiety, zawierającej między innymi pytania o interesujące zagadnienia, na które natrafili w trakcie przeszukiwania podręcznika, ocenę możliwości zastosowania tego typu źródła informacji w dydaktyce, jak również na temat jej szaty graficznej i ilustracjach. Całość eksperymentu kończono wywiadami indywidualnymi z użytkownikami, w których starano się uzyskać odpowiedzi na kwestie poziomu merytorycznego hipermedialnego podręcznika, oczekiwań samych zainteresowanych od tego rodzaju formy przekazu treści oraz o trudnościach pojawiających się podczas sesji wyszukiwawczej.

Rys. 1

Mając na uwadze kognitywistyczny punkt widzenia, modele strategii wyszukiwawczych podzielono na dwie grupy:

ze względu na wiedzę o systemie (WS),

ze względu na wiedzę o dziedzinie (WD)[5].

W wyniku obserwacji badanych wyodrębniono w obrębie kryterium wiedzy o systemie strategię poszukiwania i strategię przeglądania.

Strategia poszukiwania (WS-P) – charakteryzuje się stosowaniem wyszukiwarki „Szperacza książkowego” do odnajdywania interesujących treści w wielopoziomowym zbiorze informacji. Zasada działania wyszukiwarki stron WWW nie była znana wszystkim badanym stąd wystąpiły rozbieżne modele postępowania z tym narzędziem, które podzielono na zakończone i nie zakończone.

Poszukiwanie zakończone (WS-PZ) – polega na efektywnym posługiwaniu się szperaczem, co przejawia się w formie pytania wyszukiwawczego jakie zadano oraz wykorzystaniu uzyskanej listy rekordów z adresami stron WWW, które wyszukiwarka wyświetliła w odpowiedzi.

Poszukiwanie nie zakończone (WS-PN) – to takie, które mimo zastosowania programu wyszukującego nie kończy się sukcesem, czyli dotarciem do strony docelowej. Wynikać to może ze źle sformułowanego pytania wyszukiwawczego lub nie wykorzystania odpowiedzi podanych przez program wyszukujący.

Rodzaje komend wyszukiwawczych zadanych przez użytkowników wyszukiwarce można podzielić na dwa rodzaje: zaczerpnięte z pytania wyszukiwawczego podanego przez badającego – pytanie sugerowane, oraz ułożone na bazie wiedzy użytkownika o problemie wyszukiwawczym – pytanie niezależne. Przykłady najczęściej zadawanych pytań sugerowanych podano w tabeli nr 1.

I rok

Pytania Liczba zapytań
waza dipylońska 17
madrasy 7
Waza 4

II rok

Pytania Liczba zapytań
egiptologia 14
pergamon; sulus 7
ewangeliarz z rossano 6

III rok

Pytania Liczba zapytań
papirusy egipskie 4
egiptologia; egipt, kobiety w papirusach egipskich; kodeksy 3

Tabela 1: Najczęściej zadawane pytania wyszukiwarce. Liczba zapytań nie oznacza liczby użytkowników, którzy je zadawali

Pytania niezależne formułowane były rzadziej, najwięcej ich zadali studenci z II roku – 5, III rok – 4 i I rok – 2 pytania. Tak mała frekwencja była prawdopodobnie spowodowana tym, iż wystarczało zadać pytanie o konkretny przedmiot lub zjawisko, o które pytany był użytkownik, by uzyskać listę odsyłaczy do stron odpowiadających poszukiwanemu zagadnieniu.

Strategia przeglądania (WS-O) – polega na docieraniu do określonej strony (informacji) przez nawigowanie (żeglowanie) za pomocą hiperłączy kierujących do interesujących treści. W modelu tym można dokonać dalszego podziału na podstawie poziomu szczegółowości na którym znajduje się odwiedzona przez użytkownika strona. Hierarchia „Wirtualnej historii...” składa się z pięciu poziomów według zasady „od ogółu do szczegółu”, oraz z jednego przekrojowego, który umożliwia dostęp do całości zagadnień udostępnianych w podręczniku (Rys. 1). Model nawigowania można więc podzielić na przeglądanie płytkie i przeglądanie głębokie.

Przeglądanie płytkie (ogólne) (WS-OP) – wyróżnia się przebiegiem trasy wyszukiwawczej[6] pomiędzy stronami znajdującymi się na poziomach 1-3, z nielicznymi odwiedzinami na poziomie 4 (mniej niż ¼ łącznej liczby odwiedzin w obrębie trasy). Strategię tę charakteryzuje także częste stosowanie odsyłaczy nawigacyjnych, umieszczanych na górze lub dole strony poza tekstem głównym dokumentu.

Przeglądanie głębokie (szczegółowe) (WS-OG) - polega na docieraniu do najniższego poziomu w hierarchii systemu hipermedialnego w obrębie danego zagadnienia, np. dzieje książki irlandzkiej rozpoczynają się na trzecim a kończą na piątym. Ten model z kolei charakteryzuje się niejednokrotnym wykorzystaniem odsyłaczy semantycznych, znajdujących się najczęściej w tekście w postaci wyróżnionych graficznie wyrazów, zdań lub ilustracji[7].

Rys.2

Rysunek nr 2 przedstawia porównanie dwóch opisanych wyżej modeli strategii zaobserwowanych podczas obserwacji. Ogółem udało się zebrać 93 trasy u wszystkich badanych. Jak widać z wykresu nieco częściej stosowana była strategia przeglądania – 51 razy tj. 55%, wyszukiwanie przy pomocy szperacza było rzadziej stosowanym sposobem odnajdywania stron WWW i stanowiło 45% całości strategii wyszukiwawczych.

Aby dokładniej sprecyzować strategie przeglądania posłużono się wzorem określającym współczynnik głębokości trasy WG, który oblicza się wzorem:

WG = S/n   (1)

Gdzie S – jest sumą wartości poszczególnych poziomów, n – liczbą stron odwiedzonych w trasie wyszukiwawczej. Dla poszczególnych poziomów w hierarchii systemu przyjęto wartości od 1 dla strony powitalnej do 6 dla szperacza (Rys. 1). Im bardziej szczegółowe zagadnienia tym wyższa wartość została mu przydzielona.

Rys.3. Diagram możliwości dotarcia za pomocą hiperłączy do poszukiwanej strony. Numery w kółkach oznaczają wartości poziomów. Strona docelowa jest podkreślona.

Po analizie zapisów obserwacji i monitoringu uznano, że wartość 2,9 jest graniczną dla odróżnienia tych dwóch strategii ze względu na częstotliwość odwiedzin na stronach poziomu czwartego i piątego. Ogółem 49% strategii zakwalifikować można jako przeglądanie szczegółowe, 31% jako ogólne i 20% - mieszane, tzn. próbowano szukać jednym i drugim sposobem.

Modele zachowań informacyjno-wyszukiwawczych oparte na kryterium wiedzy o dziedzinie podzielono na dwie grupy:

Wyszukiwanie celowe (WDC) – czyli takie, w którym poszukiwanie odbywa się
w tekstach, które mogą mieć związek z danym tematem. Zainteresowany orientuje się
w dziedzinie i zagląda do stron, gdzie może znajdować się odpowiedź, np. wiedząc, że pismo sulus jest typem ozdobnego pisma arabskiego nie będzie szukał informacji o nim na stronie dotyczącej starożytnej Grecji.

Wyszukiwanie przypadkowe (WDP) – przypomina „żeglowanie” (surfowanie) – czyli powolne odkrywanie zawartości hipermedialnego systemu w podążaniu za interesującymi hiperłączami[8] – polega na odwiedzaniu wszystkich stron dostępnych z danego poziomu niezależnie od tego czy mają związek z problemem wyszukiwawczym, czy też nie. Zjawisko takie może być nazywane „zagubiony w Sieci”[9], gdyż przypomina błądzenie w gąszczu informacji.

Za pomocą obserwacji oraz analizy dokumentacji określono, iż 50% badanych stosowało tylko jedną strategię wyszukiwawczą, tzn. albo poszukiwanie albo przeglądanie, najczęściej byli to studenci II roku – 56% z tej reprezentacji badanych. Podczas wywiadu cztery osoby przyznały, że używały szperacza do znalezienia odpowiedzi na zagadnienia zupełnie nieznane, w przypadku gdy wiedziały gdzie szukać odpowiedzi – strony odnajdywano za pomocą hiperłączy. Ta charakterystyka może dotyczyć jedynie użytkowników doświadczonych w poruszaniu się po hipertekstowych serwisach.

W następnych eksperymentach zostanie zwrócona uwaga na ten model strategii łączonej. Pierwsza z hipotez przedstawionych powyżej potwierdziła się całkowicie – okazało się z dotychczasowych badań, iż mniej efektywnie wykorzystują podręcznik studenci nie znający zagadnienia niż ci, którzy nie mają orientacji w posługiwaniu systemem informacyjno-wyszukiwawczym. Być może jest to spowodowane specyfiką systemu hipertekstowego umożliwiającego porządkowanie wiedzy w sposób nieliniowy, czyli odmienny od tradycyjnego, z którym badani mieli najczęściej do czynienia. W przypadku tych drugich, dużą rolę odgrywa czynnik stopniowego nabierania doświadczenia, im dłużej posługują się systemem tym większej nabierają wprawy w wyszukiwaniu. Fakt ten zdają się potwierdzać obserwacje.

Wśród najważniejszych czynników mających wpływ na sposób wyszukiwania użytkownika wymienić należy:

wiedzę o dziedzinie z której korzysta,

wiedzę o systemie informacyjno-wyszukiwawczym,

zakres tematyczny jaki strona obejmuje,

podział danego zagadnienia na strony i podstrony (hierarchizacja)

rodzaje i umiejscowienie hiperłączy na stronie WWW.

Dalsze prace pozwolą na zweryfikowanie wymienionych czynników oddziałujących na użytkownika posługującego się hipertekstowym podręcznikiem. Niestety brak miejsca nie pozwala na przedstawienie opinii studentów nt. „Wirtualnej historii...”, jak również ich propozycji co do dalszej modernizacji podręcznika on-line. Informacje zostaną zaprezentowane podczas wystąpienia.

Literatura

[1] Podręcznik jest dostępny pod adresem: www.wsp.krakow.pl/kbin/whk

[2] Można również użyć terminu skrypt, jeżeli przyjmiemy, że jest to rodzaj podręcznika zawierającego zbiór wykładów z określonej dziedziny, przeznaczonego zwłaszcza dla studentów. Słownik Wyrazów Obcych PWN. Wydanie nowe, Warszawa 1995, s. 1020

[3] Serwis informacyjny WWW: system hipertekstowy posiadający wyróżnioną stronę główną (domową, początkową), utrzymywany przez jedną osobę lub firmę. KAZIENKO P., Struktura hipertekstu a struktura systemu WWW, Zagadnienia Informacji Naukowej, 1999, nr 1, s. 39

[4] Układ dokumentów hipertekstowych: w sieci WWW zbiór powiązanych ze sobą dokumentów tworzących całościową strukturę. PFAFFENBERGER B., Słownik terminów komputerowych, Warszawa 1999, s. 326-327

[5] SOSIŃSKA-KALATA B., Modele organizacji wiedzy w systemach wyszukiwania informacji o dokumentach, Warszawa, 1999, s. 19-36

[6] Pojęcie trasa wyszukiwawcza oznacza drogę, którą porusza się użytkownik od strony początkowej do strony docelowej, która umożliwia uzyskanie odpowiedzi na problem wyszukiwawczy.

[7] Hiperłącze nawigacyjne – umożliwiają przemieszczenie się w inne miejsce systemu hipertekstowego, np. odsyłacz kierujący do strony wstępnej (wyżej w hierarchii). Hiperłącze semantyczne (znaczeniowe) – kieruje do strony związanej tematycznie, np. szerzej omawiającej dane zagadnienie. Por. KAZIENKO P., Rodzaje stron i odsyłaczy w systemie WWW, Informatyka, 1999, nr 2, s. 23-25

[8] PFAFFENBERGER B., Słownik terminów..., s. 301

[9] KAZIENKO P., Struktura hipertekstu..., s. 51