Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet icon

Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet




Скачати 124.62 Kb.
НазваГулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet
Дата13.09.2012
Розмір124.62 Kb.
ТипДокументи

Гулик І.В., головний бібліотекар

Наукової бібліотеки ВНМУ


ЕФЕКТИВНІСТЬ ПОШУКУ ІНФОРМАЦІЇ В INTERNET


Декілька десятиліть тому один наш колега (Хорхе Луїс Борхес) в одній зі своїх розповідей описав немислимий кошмар: безмежну Вавілонську бібліотеку, яка зберігає в собі всі книги, що коли-небудь були і будуть написані всіма мовами світу. Усі можливі сполучення букв всіх алфавітів.
Серед нескінченної безлічі томів можна знайти усе що завгодно: історію вашого життя, точну хроніку кінця Світу і навіть справжнє ім'я Бога. Але в тому й справа, що знайти не можна нічого - і каталог бібліотеки, звичайно, існує, але він загублений у нескінченній книжковій масі...

Борхес і не підозрював, що його розповідь настільки точно передбачить долю тоді ще не існуючої мережі Інтернет...

Воля Мережі, доступність і простота розміщення інформації і повна незалежність серверів один від одного допомогла Інтернет стати явищем всесвітнього масштабу. Але вона ж і перетворила Мережу в хаос...

Звичайно, існує якась структура - сервери, сторінки... Але на тому самому сервері ви можете знайти зібрання мультиплікаційних картинок, методику обчислення опору сталі марки Зю-159 і канонічний життєпис Христа... І ще мільйон інших речей, про які часто не обізнаний навіть хазяїн цього сервера.

^ Трішки історії. У початковий період розвитку Інтернет, число його користувачів було не багато, а обсяг доступної інформації відносно невеликим. У березні 1989року, Тім Бернерс-Лі з Європейської Лабораторії Фізики Елементарних Часток (відомої як CERN, там знаходиться адронний коллайдер), запропонував новий спосіб обміну результатами досліджень та ідеями між організаціями. Такий обмін був дуже необхідний, тому що члени цієї організації працювали в різних країнах.
Пропонувалося використати просто систему гіпертекста для передачі документів і встановлення зв'язку між членами суспільства фізиків-ядерників. Тоді ще не було планів застосування звуку або відео і не розглядалася можливість передачі зображення. У більшості випадків доступ до Інтернет мали співробітники різних університетів і лабораторій, а в цілому Мережа використовувалася в наукових цілях. У той час завдання пошуку інформації в мережі Інтернет була далеко не стільки актуальною, як в даний час.
^ Адже на сьогодні зафіксовано по всьому світу близько 2,1 мільярда користувачів Інтернету, практично половина з них - жителі азіатських країн.

Тож як бути? Як відшукати серед мільйонів сторінок ту саму, єдину і неповторну, на якій саме і знаходиться потрібна вам інформація? Розглянемо те чим ми можемо скористатися на сьогодні.

Для здійснення пошуку існують каталоги інтернет-ресурсів. Вони мають ієрархічну структуру, тобто побудовані за принципом „від загального – до часткового” й володіють зручною деревоподібною структурою. Зайшовши на титульну сторінку будь-якого каталогу, ви одразу ж наштовхнетесь на перерахунок основних категорій – „Комп’ютери”, „Інтернет”, „Культура”, „Наука” і так далі. Клацніть по будь-якому посиланню, наприклад, „Комп’ютери” – і ви перейдете на іншу сторінку, яка, в свою чергу, запропонує вам список підрозділів. Ось так, крок за кроком, поступово звужуючи тему, ви і зможете добратися до сторінки з перерахунком посилань на сайти, які вас цікавлять. 

Приклади каталогів:

http://meta.ua/reestr.asp  — каталог українських ресурсів на МЕТА

http://top100.rambler.ru — каталог Тор100 на Rambler

http://yaca.yandex.ru — каталог Yandex

http://dir.bigli.ru — каталог Біглі

Каталоги посилань широко використовувалися раніше, але практично втратили свою популярність в даний час. Причина цього дуже проста - навіть сучасні каталоги, що містять величезну кількість ресурсів, представляють інформацію лише про дуже малу частину мережі Інтернет. Найбільший каталог мережі DMOZ (або Open Directory Project) містить інформацію про 5 мільйонів ресурсів, у той час як база пошукової системи Google складається з більш ніж 8 мільярдів документів.

Першою повноцінною пошуковою системою став проект WebCrawler що з'явився в 1994 році .
У 1995 році з'явилися пошукові системи Lycos і AltaVista. Остання довгі роки була лідером в області пошуку інформації в Інтернет.
У 1997 році Сергій Брін і Ларрі Пейдж створили Google в рамках дослідницького проекту в Стенфордському університеті. 23 вересня 1997 була офіційно анонсована пошукова система Yandex, найпопулярніша в російськомовній частині Інтернет.

В даний час найпопулярнішими серед користувачів пошуковими системами є:

Google Сама популярна й швидка пошукова система, підтримує всі мови, дозволяє організувати пошук на вашому персональному сайті.

Alta Vista Надзвичайно швидка пошукова система. Містить інформацію про більш як 65 мільйонів сторінок WWW, у тому числі дозволяє шукати за російськими словами.

Lycos Пошукова система, яка дозволяє вести пошук за заголовками документів та за їхнім змістом. Вона містить один із найбільших індексів мережі.

Yahoo - англомовний пошуковий сервер.

Rambler Російська пошукова система, що спеціалізується на російськомовній інформації. Має відмінний тематичний каталог із рейтингом відвідування серверів.

Яndex Російська пошукова система, що спеціалізується на російськомовній інформації з можливістю передачі запитів у Alta Vista. Дуже висока точність результатів пошуку. У число можливостей Яndex входить пошук за назвами картинок, за java-аплетами та ін.

Meta - український пошуковий сервер;

На діаграмі показана питома вага популярності різних пошукових систем.

В 2011 році більше як 80% всього пошуку в Інтернеті доводитися на 3 основні системи: ^ Google, Yahoo!, MSN.

В Рунеті основними є пошукові системи: Яndex, Rambler та Mail.ru

Використання пошукових систем (машин), які періодично нишпорять по всьому просторі Мережі — один з основних методів пошуку потрібної інформації. Інколи ці системи називають „пошуковими роботами” або навіть „павуками”. Що ж, закономірно: якщо існує Всесвітня Інформаційна Павутина (WWW World Wide Web), то чому б в ній не завестись павукам?

Нишпорячи по хитрих переплетіннях Мережі, „павуки” щоденно і навіть кожної години заповзають практично на всі доступні сторінки і заносять їх в спеціальний індекс, величезну базу даних, по яких потім і ведеться пошук. Ця база даних поновлюється значно частіше, ніж в каталогах – приблизно раз в місяць проводиться її переіндексація. Час повторного заходу робота пошукових систем може вимірюватися для різних сайтів як у хвилинах, так і в роках. Розумні пошукові системи встановлюють індивідуальний графік відвідування для різних сторінок різних сайтів Звісно, навіть при такій частоті поновлення в базах пошуковців з часом утворюються залежні „мертвих” посилань, зате в порівнянні з каталогами їх кількість в кілька разів менша. А вже про об’єм інформації і зовсім не доводиться говорити – якщо більшість користувачів знайомі лише з невеликою частиною складової Мережі, то пошуковим роботам доступний кожен її куточок, кожна сторінка. 

Пошуковий робот, на відміну від людини, холоднокровний до рекламних заманливих оголошень. Його завдання просте: «сфотографувати» те, що знаходиться на сторінці на сайті і занести це в загальний індекс. 
Однак пошукові роботи рідко покладаються тільки на внутрішній «індекс» сторінки. Тому більшість серйозних пошукових систем не обмежуються поглядом в індекс, а добросовісно сканують всю сторінку – на всякий випадок.
Що відбувається потім? Користувач, зайшовши на сторінку «пошуковця», вводить слово, за яким повинен буде здійснюватись пошук. А потім отримує довгоочікуваний результат – гору корисних і непотрібних посилань.
На жаль, здійснювати пошук за окремими словами – робота невдячна. Бо в цьому випадку замість очікуваної чіткої і короткої вибірки сайтів, ви отримаєте стіг сіна з маленькою голкою.

Інший, простіший випадок. Припустимо, вам потрібно знайти в Мережі інформацію про «Електронна бібліотека України”. Набравши в пошуковій сторінці Google, „Яндекса” або „Рамблера” це словосполучення, ви можете відшукати потрібну інформацію... Але зробити це буде непросто. Адже в цьому випадку система просто завалить вас горою посилань на сторінки, на яких зустрічаються слова „електронна”, „бібліотека”, «Україна» . При цьому одне слово може бути на початку сторінки, друге – всередині, а третє – взагалі кінці!
Таких сторінок в Мережі знайдеться немало...
Особливо важко подружитися з пошуковою системою тим, кому потрібно здійснити пошук по дуже специфічній темі, оперуючи при цьому самими простими словами. 
Індексуючи сторінку, пошуковець працює одразу з кількома елементами її змісту:
•   Заголовок сторінки
•    Список „ключових слів”, складений її автором
•    Короткий опис сторінки
•    Власне зміст сторінки
Тобто, якщо задані вами ключові слова будуть знайдені в заголовку, описі, і в самому тексті сторінки, то ступінь її популярності буде досить високою. І велика ймовірність, що у вигляді посилання на цю сторінку ви здобули безцінний інформаційний скарб! А якщо ключові слова будуть знайдені лише в описі, то „робот” напевне занесе її в список підозрілих.
Але навіть якщо хазяїн „павука” і полегшив йому завдання, виключивши із списку елементів сторінки, які обшукуються, він завжди знайде на що звернути увагу при визначенні ступеня популярності сторінки. 
На жаль, пошукові роботи не дуже інтелектуальні – до того ж на їх машинну логіку інколи накладається недалекість самих користувачів. 

Інформаційне перевантаження (інформаційний шум - інформація чи повідомлення, яке не веде до поставленої мети) – це, мабуть, один із найбільш очевидних наслідків розповсюдження та розвитку Інтернету в глобальних масштабах. Тому я не люблю блоги – інформація, яку вони продукують, часто страждає від низької якості і лише поповнює архіви сміття, в якому блукатиме випадковий відвідувач, коли захоче знайти певний корисний йому матеріал.

^ Практичні поради.

Перш за все потрібно визначитися з метою пошуку і мовою запиту: рос., укр., англ. та ін. При цьому потрібно концентруватися не тільки на самій меті, але і на тому, що може її супроводити (ключові слова, спеціальні терміни тощо).

Увага! Кількість україномовних сторінок в мережі Інтернет значно нижча, ніж російськомовних і тим більш англійських.

По-друге, потрібно вибрати пошукову систему. Українську мову підтримують всі російськомовні системи. Крім того існує українська пошукова система МЕТА (meta.ua), але база її дещо обмежена. Для пошуку інформації іноземними мовами зазвичай використовують Google, який підтримує більше 30-ти мов і має зручну настройку, де можна задати: «Шукати сторінки тільки такими мовами».

Іноді для пошуку інформації доцільно використовувати декілька пошукових машин (так званий метапошук). 

Слід також пам’ятати, що пошукові машини відрізняються не тільки підтримуваними мовами. Різниця в способах індексування дає різні результати при пошуку. Наприклад, за одним і тим же запитом: «Вінницька обласна універсальна наукова бібліотека» «Яндекс» видає результат – 146000 сторінок, Google – 132000, Рамблер – 159000.

Для простого пошуку потрібно зайди на будь-який із сайтів-пошуковиків і в рядок пошуку ввести ключові слова. Наприклад, необхідно знайти розклад потягів що проходять через Калинівку. Можна так і спробувати «запитати» пошукову систему: «розклад всіх потягів, що проходять через Калинівку». Регістр - тобто рядкові букви або прописні - значення не має. І натиснути на клавіатурі клавішу «Enter» (введення) або кнопку пошуку поряд з рядком.

Проте, за таким запитом пошукова система знаходить розклади поїздів, що проходять також через Львів, Київ, Самару тощо. Калинівки серед отриманих результатів може навіть не бути. Це у жодному випадку не означає, що цієї інформації в базі пошукової системи немає, просто запит був сформульований не дуже вдало.

Річ у тому, що будь-яка пошукова система прагне знайти сторінки, на яких знаходиться максимальна кількість слів із уведеного запиту, більш того, якщо ці слова ще слідують одне за одним, то такі сторінки будуть виведені першими. Тому потрібно такий запит скорегувати, прибравши всі слова-паразити і залишивши тільки слова, які точно характеризують інформаційну потребу. У нашому випадку словами-паразитами є «всіх, що проходять через», які можуть зустрічатися на яких завгодно сторінках. Задавши скорегований запит «розклад потягів Калинівка», отримаємо в точності те, що шукали.

Слід пам’ятати, що пошукова машина сама розташовує результати пошуку за релевантністю, тобто за найкращою відповідністю запиту. Це означає, що найпершими будуть розташовані посилання на документи, в яких слова, що шукаються, знаходяться поряд одне з одним, ближче до початку сторінки або в заголовках. Результати пошуку виводяться посторінково. Кількість посилань на одній сторінці для більшості пошукових систем дорівнює 20, але це число можна змінити в настроюваннях. Зовсім не обов'язково проглядати всі виведені посилання, потрібна інформація, зазвичай, міститься на перших 3—5 сторінках. У деяких випадках доцільно змінити або скорегувати запит.

Іноді необхідно не прибирати зайві слова, а навпаки деталізувати запит, якщо слова, задані для пошуку, дуже загальні. Наприклад, пошук по слову «фантастика» дасть тисячі абсолютно різноманітних документів. «Українська фантастика» звузить круг пошуку. «українська фантастика Литовченко» буде найбільш точним для пошуку інформації про письменника-фантаста Тимура Литовченка.

У більшості випадків просто скорегувати запит недостатньо. Необхідно використовувати оператори мови запитів пошукової системи. Ці оператори допоможуть знаходити інформацію, яку за допомогою простих запитів знайти дуже важко, подекуди й зовсім неможливо.

Операторами, спільними для всіх пошукових систем, є наступні.

Оператор

Опис

Приклади

+

Логічне і. Даний оператор є за замовченням і діє першим.

Запит “українські реферати” є рівнозначним до  запиту “українські + реферати”.

_

Логічне НІ дозволяє виключити із списку результатів документи, в яких міститься слово, що йде після оператора.

За запитом: “кавовий напій – кава”, будуть знайдені тільки ті документи, в яких є слова кавовий напій, але немає слова кави.

\

Логічне АБО- дозволяє знайти документи, які містять хоча б одне слово в запиті.

За запитом: “казаки | козаки” будуть знайдені документи, які містять або слово казаки, або слово козаки.

"..."

Подвійні лапки дозволяють знаходити точне словосполучення, що в них вказано.

Фіксується граматична форма слів, тобто за запитом "погода в Криму" будуть знайдені документи, в яких міститься таке саме словосполучення, - погода в Криму.

{...}

Фігурні дужки дозволяють знаходити словосполучення, що є близькими до вказаного в них.

За запитом {погода в Криму} будуть знайдені документи, що містять наступні словосполучення: "погода в Криму", "погоді в Криму", "погоди в Криму", тобто граматична форма слів в даному випадку не фіксується.

[n, ...]

Цей оператор використовується в тому випадку, якщо необхідно обмежити відстань між словами запиту.

За запитом [5, мобільний телефон] будуть знайдені тільки ті документи, в яких слова мобільний і телефон розташовані у фрагменті тексту, що не перевищує 5 слів.


Передбачені також оператори, що дозволяють обмежити область пошуку певним полем документа.


Оператор

Опис

Приклади

Title

Даний оператор дозволяє шукати тільки за назвою документа.

За запитом: title(прайс-лист) будуть знайдені ті документи, в заголовку яких міститься прайс-лист, за запитом title("дошка оголошень") будуть знайдені документи, які містять в заголовку словосполучення дошка оголошень.

Heading

Даний оператор дозволяє проводити пошук за назвами розділів документів.

За запитом: heading(бізнес-план) будуть знайдені документи, що містять бізнес-план в полі heading документів.


Наприклад, можна задати умову точної відповідності фрази без урахування словоформ. У Яндексі ця умова називається «употреблены в тексте: точно так, как в запросе», в Рамблері- «Искать слова запроса: точную фразу», в Google -«Знайти результати, що містять точну фразу» і т. д.

^ Якщо Вам необхідно:

- знайти точну фразу на якомусь конкретному сайті, тоді потрібно запит взяти в лапки і після нього прописати site:назва сайту.

- включити в запит якесь слово і його синоніми, пишемо запит ось так: "інтернет маркетинг" ~професіонал.

- знайти документи конкретного формату на певну тему, то вводимо запит на зразок цього: "інтернет маркетинг" filetype:doc

- знайти власника якогось телефонного номеру, то можна спробувати ввести наступне: phonebook:617-555-1212

- знайти щось, що відбувалося між двома датами, вводимо щось на зразок цього: війна 1992...2000

- швидко помножити два числа, вводимо запит таким чином:
48512 * 3.9

- знайти тлумачення певної фрази, шукаємо її за запитом:
define: рекаталогизация


Сподіваюся, що приведені поради виявляться корисними, і бажаю вам вдалого пошуку!

Схожі:

Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconУдк 027. 7: 377. 44 Лисенко Л. В., головний бібліотекар бібліотеки внз укоопспілки «Полтавський університет економіки І торгівлі»
Лисенко Л. В., головний бібліотекар бібліотеки внз укоопспілки «Полтавський університет економіки І торгівлі»
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconКривошия Тетяна Петрівна Головний бібліотекар нтб національного університету «Львівська політехніка»
Вивчення ефективності використання інформаційно-пошукової системи бібліотеки І вироблення рекомендацій щодо її удосконалення
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconНаукової роботи під шифром "Маршрутна мережа"
...
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconПро визначення стратегічних перспектив у Програмі розвитку університетської бібліотеки та організаційні засади їх виконання на досвіді бібліотеки Полтавського університету споживчої кооперації
У статті проаналізовано досвід формування стратегічної Програми розвитку університетської бібліотеки та ступінь її впливу на ефективність...
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconІнформаційне забезпечення користувачів бібліотеки: минуле, теперішнє, майбутнє льода Л. М., Дзендзелюк Л. С
Відділ наукової реставрації та консервації рідкісних видань Львівської національної наукової бібліотеки України
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconПолітика зберігання фондів як засіб якісного інформаційного забезпечення науки та освіти Маєвська Л. В., бібліотекар І категорії наукової бібліотеки Вінницького національного медичного університету ім. М.І. Пирогова
Складовою цього напрямку роботи є зберігання документально-інформаційних ресурсів, яке включає облік, раціональне розміщення, реставрацію,...
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconПравила або умови пошуку на сайті Бібліотеки України
Електронні бібліотеки (науково-інформаційні ресурси мережі Інтернет), електронна адреса
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconМоделі подання знань про сталі інформаційні інтереси користувачів в інформаційно-пошукових системах
Розглянуто онтологічний підхід до інформаційного пошуку в Інтернеті, який через збільшення обсягу інформації І розосередження її...
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconШтат бібліотеки
Бедер Антоніна Василівна–провідний бібліотекар, освіта повна вища спеціальна, стаж бібліотечної роботи-27 р.,6 м
Гулик І. В., головний бібліотекар Наукової бібліотеки внму ефективність пошуку інформації в internet iconПравила або умови пошуку на сайті Бібліотеки України Національні Національна бібліотека України імені В. І. Вернадського
Електронні бібліотеки (науково-інформаційні ресурси мережі Інтернет), електронна адреса
Додайте кнопку на своєму сайті:
Документи


База даних захищена авторським правом ©zavantag.com 2000-2013
При копіюванні матеріалу обов'язкове зазначення активного посилання відкритою для індексації.
звернутися до адміністрації
Документи