Электронные рекомендации / Раздел 3 - Рекомендации при решении технических вопросов / 3.5. Описание, поиск и получение электронных ресурсов / Проект«Пульман-XT». Публичная библиотека Новоуральского городского округа.
Муниципальное учреждение культуры Лого Центральной публичной библиотеки Новоуральска Публичная библиотека Новоуральского городского округа
Страницы читателей
Страницы библиотекарей
Страницы читателей / Главная / Проект PULMAN-XT / Электронные рекомендации / Раздел 3 - Рекомендации при решении технических вопросов / 3.5. Описание, поиск и получение электронных ресурсов
Проект Европейской комиссии PULMAN-XT
Extending the European research Network for Public Libraries, Museums and Archives


Резюме

Круг рассматриваемых вопросов
Данное руководство рассматривает вопросы, связанные с растущим объемом цифрового материала доступного в настоящее время библиотекам, включая метаданные, контролируемый словарный запас, тезаурусы, поисковые системы, межсетевые преобразователи (шлюзы), форматы XML и Z39.50.

Составляющие политики
Развитие Интернет означает, что в настоящее время библиотеки могут иметь доступ к всевозрастающему количеству цифровой информации, которую можно найти в Сети. Библиотеки должны знать, как наилучшим образом они могут помочь своим читателям в поиске и извлечении необходимой им информации в электронном пространстве. Образованное общество, непрерывное образование и возрастающее стремление к взаимодействию с центральным правительством посредством электронных средств связи — все это способствует увеличению значимости поиска и извлечения информации для всех граждан. При этом ключевая проблема заключается во взаимозаменяемости цифровой информации.

Полезные практические рекомендации

Данный раздел состоит из трех составляющих:

  • Описание ресурсов: различные средства описания ресурсов, способствующие точности извлечения информации, например метаданные, системы лингвистического обеспечения, такие как тезаурусы и однозначные идентификаторы.
  • Поиск и извлечение ресурсов: средства, с помощью которых ресурсы могут быть найдены и извлечены; например, поисковые системы, шлюзы, предметные указатели информации. С логической точки зрения обнаружение ресурсов — второстепенная операция. Если дано место описание объекта поиска, то машина, проводящая поиск, обладает хорошими шансами на его нахождение. Это та область, в которой библиотеки имеют возможность работать в сотрудничестве с другими организациями, например с колледжами и университетами для обеспечения лучшего доступа к своим ресурсам. Для партнеров вполне типично предоставлять совместный доступ к своим каталогам .
  • Основные технологии: XML, RDF, Z39.50, извлечение изображений, включая поиск по содержанию, онтологии и тематические карты, которые используются в данной области.

Планы на будущее
В будущем людей будут окружать умные, ответственные и надежные машины, способные отвечать индивидуальным требованиям пользователей. Ряд программ, описанных в данном руководстве по цифровым технологиям, сейчас уже существуют, но их полноценное использование все еще плод воображения. Преобразования затронут частные дома, школы. гостиницы, автомобили, самолеты — то есть, все аспекты жизнедеятельности. А их влияние на библиотеки и другие культурные учреждения будет иметь долгосрочный характер.

КРУГ РАССМАТРИВАЕМЫХ ВОПРОСОВ

Проблемы, рассматриваемые в данном руководстве, включают:

  • Описание ресурсов
  • Метаданные
  • Описание уровня собрания материалов
  • Контролируемые словари и тезаурусы
  • Однозначные идентификаторы
  • Обнаружение ресурсов
  • Библиотечные каталоги
  • Поисковые системы
  • Списки рекомендуемых сайтов
  • Шлюзы и порталы
  • Группы
  • Общественная информация
  • Поддержка обучения
  • XML
  • RDF
  • Z39.50
  • «Harvest»
  • Извлечение изображений
  • Планы на будущее
  • Семантическая Сеть
  • Онтологии
  • Цифровые подписи
  • Услуги сетевого обслуживания
  • Передовой опыт — ссылки

Примечание: Предполагается, что библиотеки будут подходить к решению проблем описания, поиска и извлечения ресурсов с различных стартовых позиций, и что большинству из них, если не всем, возможно, придется использовать стратегию внедрения усовершенствований поэтапно. Также предполагается, что данное руководство может быть использовано как помощь в процессе приобретения библиотечных систем или назначения подрядчиков и консультантов.

СОСТАВЛЯЮЩИЕ ПОЛИТИКИ

Соответствие библиотечному обслуживанию
Библиотеки осуществляют свою деятельность в сетевой информационной среде. Распространение Интернет приводит к тому, что даже небольшой филиал библиотеки в настоящее время может предлагать доступ к постоянно увеличивающемуся количеству распространяемой информации, имеющейся в Сети. Библиотекари должны знать то, каким наилучшим образом они смогут оказывать содействие своим пользователям в поиске и извлечении необходимой им информации. Образованное общество, непрерывное образование и растущий стимул к взаимодействию с центральным правительством с помощью электронных средств, облегчающих доступ к информации, приобретают все большую значимость для всех граждан.
Многие библиотеки также создают новые цифровые материалы самостоятельно, будь то библиотечные Web-страницы или новые мультимедийные материалы, иногда финансируемые специальными программами оцифровки. (См. Оцифровка и Финансирование). Библиотекам необходимо разобраться в том, как описывать создаваемый новый материал, чтобы впоследствии пользователи могли извлечь его без труда, и чтобы его параметры были совместимы с характеристиками других цифровых материалов.

Технологии и стандарты в данной области еще находятся в стадии разработки, и процесс их изменения и усовершенствования займет еще некоторое время. Библиотекам необходимо разобраться в вопросах текущего состояния дел в данной области для того, чтобы они могли избежать опасности принятия несоответствующих их работе или устаревших технологий и стандартов.
Библиотеки должны быть осведомлены во всех этих вопросах для того, чтобы эффективно планировать свою деятельность и выбирать приоритетные направления развития, особенно в случае приобретения новых систем или привлечения сторонних консультантов или подрядчиков для реализации планов дальнейшего развития.

Что такое взаимозаменяемость?
В отношении цифрового содержания взаимозаменяемость материала означает, что он должен настолько насколько возможно широко использоваться, функционировать в различных сетях, системах или организациях и иметь максимальную возможный срок эксплуатации. Ключ к решению данной проблемы — стандарты, кодированные правила и рекомендации для создания, описания и управления цифровыми ресурсами. (Для более подробной информации см. «Изобретение заново колеса» (Reinventing the Wheel)). Журнал «D-Lib» январь 2002 г.

Почему взаимозаменяемость имеет важное значение?
Для того, чтобы потенциальным пользователям было легче осуществлять поиск и извлечение информации из различных источников: разного рода каталогов, доменов (библиотеки, музеи, архивы) и среди различных типов ресурсов.

Новые услуги и различные рабочие нагрузки
Помещение в Интернет ресурсов, как созданных самой библиотекой, так и приобретенных каким-либо образом (сотрудничество, покупка/ лицензирование и т. д.) требует определенного рода знаний, следовательно, требуются определенные виды тренинга для данных сотрудников. Необходимо также определить типы предоставляемых услуг и то, каким путем эти услуги будут предоставляться. См. мультимедийные средства. Библиотекам предстоит сделать стратегический выбор на местном уровне в отношении своих будущих приоритетов, относительно той суммы денег, которую они готовы потратить и того, что они хотят предпринять.

Возрастающая зависимость от цифровых материалов
Библиотекам предстоит обрабатывать постоянно увеличивающееся количество материалов, имеющих важное значение для пользователей и существующих только в электронной форме. Этот материал может быть более дорогим относительно его печатного варианта и попадать под наблюдение и контроль со стороны издателя или дистрибьютора. Важное значение будет иметь лицензирование.

ПОЛЕЗНЫЕ ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ: ОПИСАНИЕ РЕСУРСОВ

Библиотеки должны рассмотреть вопрос о присоединении метаданных к тем ресурсам и Web-страницам, которые они сами создают. Также им следует уделить внимание вопросу использования формата XML.

Метаданные
Кратко их можно определить как «структурированные данные о других данных». Запись в каталоге, например, представляет собой метаданные, с помощью которых можно описать отдельно взятую книгу. Метаданные нашли свое широкое применение в качестве средства улучшения оптимальности и эффективности поиска цифровых ресурсов Сети путем принятия последовательной системы описания Web-сайтов и других видов цифровых ресурсов. В число видов элементов метаданных, которые могут использоваться для описания книги могут входить: автор, название, издательство, дата, ISBN, классификация и т. д., а в отношении web-станиц важно выделять: название, создателя, тему, описание и т. д. Заслуживающие внимания введение в данную тему можно найти на Web- сайте Diffuse.
Метаданные могут быть использованы для оказания помощи в достижении разнообразных целей.
Метаданные описания ресурсов — используются для описания ресурсов и содействия процессу извлечения информации. Существуют различные типы данных ресурсов, из которых в качестве наиболее широко известных можно выделить Marc и Dublin Core Marc, или Machine Readable Cataloguing (каталогизация с использованием машинно-читаемых документов) — это схема библиографических метаданных, применяемая в библиотеке Конгресса. Современная версия данного типа — MARC 21.
Dublin Core — система описания «документов как объектов», состоящая из следующих 15-ти элементов метаданных:

  1. название
  2. автор
  3. тема
  4. описание ключевыми тематическими словами
  5. издатель
  6. соучастники, помощники
  7. дата
  8. тип ресурсов
  9. формат
  10. идентификатор ресурсов
  11. источник
  12. язык
  13. взаимосвязь.
  14. охват
  15. вопросы, касающиеся авторского права.

Метаданные хранения — применяются для поддержки процессов хранения и архивирования. Вопросы, связанные с процессом хранения цифровых ресурсов рассматриваются в проекте CEDARS Project.
Метаданные по правовым вопросам — используются для отражения материалов, касающихся права интеллектуальной собственности в отношении ресурса. См. в качестве примера Indecs Project.
Образовательные метаданные — используются для содействия в выполнении задач по извлечению ресурсов, которые решаются образовательными учреждениями, а также в ходе работы с управляемой или виртуальной образовательной средой, например, записями учащихся и описанием предметных курсов. За более подробной информацией по вопросам использования метаданных для поддержки программы «электронного обучения» обращайтесь на сайт Diffuse.
Геопространственные метаданные — используются с цифровыми картами и географическими информационными системами (Более подробную информацию по стандартам обмена географическими метаданными можно найти на сайте Diffuse).
Специализированные метаданные были разработаны с целью удовлетворения специфических требований, предъявляемых к отдельным областям, например:

  • Архивы обычно используют стандарт «кодированного описания архивов» (EAD — Encoded Archival Description) или «общий международный стандарт описания архивов» (ISAD(G) — the General International Standard Archival Description). За более подробной информацией по архивным стандартам обращайтесь на Web-сайт Diffuse.
  • Музеи — «международный консорциум учреждений культурного наследия» (CIMI — international consortium of cultural heritage institutions), работающих в сотрудничестве для оказания содействия развитию и применению стандартов к музейной информации. За более подробной информацией по музейным стандартам обращайтесь на Web-сайт Diffuse.
  • Правительство — «услуга по обнаружению правительственной информации» (GILS — Government Information Locator Service/Global Information Locator), часто используется при работе с правительственной информацией, хотя в последнее время многие правительственные учреждения отдают предпочтение стандарту Dublin Core. В ходе реализации инициативы «Dublin Core» в отношении метаданных (The Dublin Core Metadata Initiative (DCMI)) была создана Рабочая правительственная группа (Government Working Group). Правительства многих стран, например, Великобритании, Австралии, Канады, США и Дании выпустили рекомендации, которые подлежат исполнению организациями общественного сектора, включая и библиотеки. См. Структура взаимодействия в рамках программы «электронное правительство» («e-gif» — Electronic Government Interoperability Framework), и «Стандарт метаданных программы «электронное правительство» (e-gms — (Electronic Government Metadata Standard)), программы «электронное правительство» (e-Envoy’s Office) в Великобритании. Первая версия e-gms опиралась на упрощенный вариант стандарта Dublin Core, в то время как вторая уже перешла на использование квалифицированной версии стандарта Dublin Core, содержащего некоторые дополнительные элементы управления документооборотом.

Описание собрания материалов
В ходе реализации крупных совместных проектов может также возникнуть потребность рассмотреть использование метаданных описания собрания материалов, для того, чтобы описать фонды принимающих участие в проекте библиотек (охват, уровень, глубину, язык и т.д.). См. в качестве примера: «Взгляд на описание собрания материалов» Департамента Великобритании по библиотечным сетям (UKOLN Collection Description Focus for information) в котором говориться об использовании программ описания собрания материалов в образовательном секторе высшего и «последующего» (после школьного) образования Соединенного Королевства, а также обратитесь к руководящим документам Фонда новых возможностей (NOF guidelines), за примером адаптации систем описания собрания материалов финансовыми отделами публичных библиотек.

Контролируемые словари и тезаурусы
Метаданные представляют собой только половину решения проблемы. Если пользователи захотят осуществить эффективный поиск определенного рода сведений, тогда создателям данных информационных массивов необходимо определенным последовательным образом придать какое-то значение всем элементам метаданных. Для этого им необходимо использовать определенного рода схемы кодирования или управляемые словарные системы для создания предметно-тематической адресации. Хорошим примером в данном случае может служить предметно-тематические указатели библиотеки Конгресса.
Тезаурус — это определенного рода управляемый словарь, термины которого организованы по иерархической схеме, показывающей такие характеристики как широкое и узкое значение термина, эквивалентность и частичную эквивалентность, и в которой термины подразделяются на основные и дополнительные (для учета синонимии). Также для них типично включение ряда примечаний и другой полезной информации. В международной системе по стандартам существует два вида стандартов для тезаурусов: ISO 2788, 1986 «Руководство по утверждению и разработке одноязычных тезаурусов» (Guide to establishment and development of monolingual thesauri); and ISO 5964, 1985 Guide to the establishment and development of multi-lingual thesauri. «Руководство по утверждению и разработке многоязыковых тезаурусов».
Сайт музея Гетти содержит ряд тезаурусов включая «тезаурус Гетти по искусству и архитектуре» Art and Architecture Thesaurus и «тезаурус Гетти географических названий» Thesaurus of Geographic Names. Траугот Кох (Traugott Koch) собрал полезный перечень управляемых словарей, тезаурусов и классификационных схем. (list of controlled vocabularies, thesauri and classification schemes)

Однозначные идентификаторы
Для того, чтобы иметь возможность быть обнаруженным в Сети каждый ресурс должен иметь однозначный идентификатор или адрес, такой как например унифицированный указатель ресурсов (URL — Uniform Resource Locator). Проблема в отношении данных указателей, как известно каждому пользователю Интернет, состоит в том, что данные унифицированные указатели ресурсов со временем изменяются, что затрудняет процесс поиска и извлечения информации. Цифровой идентификатор объекта (DOI — Digital Object Identifier) — это тот постоянный идентификатор, который может послужить решением данной проблемы. Пол Миллер (Paul Miller) написал статью, в которой доходчиво изложил функции однозначных идентификаторов (article).

ПОЛЕЗНЫЕ ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ: ПОИСК И ИЗВЛЕЧЕНИЕ РЕСУРСОВ

Поисковые системы
Библиотечный каталог представляет собой ключ доступа к фондам отдельной библиотеки. Однако, многие, если не большинство библиотек, предлагают своим пользователям доступ посредством Интернет. Соответственно, им приходится находить способы оказания помощи своим пользователям в процессе нахождения нужных им сетевых ресурсов. Самое легкое для библиотек решение данной проблемы — просто направить пользователей к одной из многих существующих поисковых систем.

Данные системы бывают следующих видов:

  • Поисковые системы свободного текста, поиск в которых ведется на основе введения ключевых слов. К таким системам относятся Altavista, Google.
  • Поисковые системы с предметно-каталоговой системой поиска, работая в которых пользователь осуществляет свой поиск через ряд поисковых операций, постепенно сужая и конкретизируя поступающую информацию, например Yahoo.
  • Мета/ мульти поисковые системы, в ходе деятельности которых поиск осуществляется при помощи сразу нескольких поисковых систем. Например, ixquick.
  • Поисковые системы, использующие естественный язык, поиск в которых можно осуществлять при помощи фразы в вопросительной форме. Например, Ask Jeeves.

Более подробный список поисковых систем всех типов, а также информацию о них можно найти на сайтах www.philb.com и http://searchenginewatch.com. На них содержится информация по вопросам осуществления поиска в Сети, анализируется индустрия поисковых систем и даются советы владельцам сайтов как повысить степень способности быть найденными в Сети.

Списки рекомендуемых сайтов
Библиотеки должны уделить внимание вопросу оказания содействия своим пользователям по созданию перечня полезных Web-сайтов. Обычно оценка данного рода информации осуществляется на основании определенных критериев качества (в ходе реализации проекта «Desire» были разработаны определенные полезные критерии оценки сайтов, assessment). Сайты также часто подразделяются по тематическому признаку. Сеть обнаружения ресурсов может служить этому хорошим примером (RDN — Resource Discovery Network) . Однако, процесс обновления и поддержания функциональности данных списков может занимать значительное количество времени. Возможно, библиотекам стоит рассмотреть возможность сотрудничества для создания и поддержания функциональности данных перечней сайтов. «Совместная служба каталогов сетевых ресурсов» (CORC, the Co-operative Online Resource Catalog Service), Онлайнового библиотечного компьютерного центра может послужить в качестве хорошего примера совместной инициативы по созданию описаний Web-страниц.

Шлюзы и порталы
Различие в определении между шлюзами и порталами достаточно размытые, но для шлюза типично наличие ряда аннотированных ссылок на те Web-сайты, которые были проверены создателями данной программы-шлюза. Пользователю может быть представлен ряд меню, с помощью которых он может продвигаться в своем поиске от более общих терминов к более конкретным. Данные сайты обычно являются очень полезными для исследователей, так как они экономят их время, затрачиваемое на просматривание сайтов, одного за другим, пока не будет найдены один, два, довольно приличного качества и подходящего содержания. Порталы обычно предназначены для предоставления своим пользователям услуг помимо приведения списков разнообразных ссылок, например, они могут предлагать услуги по совершению всякого рода онлайновых операций, например, покупки товаров и т. д. Они также могут поддерживать поиск через содержание тех сайтов, ссылки на которые они приводят в определенном интегрированном режиме.

Перечислить все шлюзы не представляется возможным, но можно привести следующие примеры:

  • Общие www.yahoo.com серии меню, охватывающие всю глобальную гипертекстовую систему Интернет в целом.
  • Правительственные www.ukonline.gov.uk перечень Web-сайтов правительства Великобритании и Web-сайты местных органов власти, организованные по тематическому и алфавитному порядку, www.premier-ministre.gouv.fr — шлюз к представительствам правительственных учреждений Франции.
  • Научные www.rdn.ac.uk Сеть обнаружения ресурсов, созданная в поддержку решения проблем секторов высшего и дальнейшего (в дополнении к школьному) образования в Великобритании. Фактически, это сеть, состоящая из предметных шлюзов, или концентраторов, каждый из которых, посвящен отдельной теме.
  • Библиотечные UNESCO libraries portal (библиотечный портал ЮНЕСКО)
  • Музеи 24 Hour Museum
  • Архивы the UNESCO archives portal
  • Культура новый портал Европейской Комиссии European culture portal
  • Остальные www.teldir.com ряд ссылок на онлайновые телефонные справочники.

Существует специализированное программное обеспечение, предназначенное для оказания помощи в разработке и поддержании в должном рабочем состоянии предметных шлюзов, например, «Организация и обнаружение ресурсов служб основанных на тематическом принципе» (ROADS — Resource Organisation and Discovery in Subject based services). Коммерческие компании также предлагают программное обеспечение, относящееся к работе с порталами, например, Vignette, SAP Portal, Plumtree и т. д. Некоторые библиотеки начинают создавать свои собственные порталы и шлюзы, для того, например, чтобы поддержать «группы сотрудничества», службы общественной информации и оказать содействие образованию.

Группы сотрудничества
Группы сотрудничества — это ряд организаций, обычно публичные библиотеки, научные библиотеки и другие организации (например, музеи и архивы), которые договариваются о сотрудничестве в таких областях, как совместное приобретение ресурсов (в особенности электронных ресурсов), межбиблиотечный абонемент, а также путем объединения своих каталогов. Важная особенность всех групп сотрудничества состоит в том, что они создают шлюз или портал, на котором имеются средства, позволяющие пользователю осуществлять одновременный поиск по всем каталогам и/ или базам данных всех принимающих участие в данном проекте организаций. Для того, чтобы предоставить такую возможность группа сотрудничества со своей стороны должна принять единый набор параметров метаданных, на основе которого будут строить свою работу все члены консорциума. Ряд параметров был разработан специально в поддержку данного вида деятельности, например, «Bath Profile» или «ONE-2 Profile». Для улучшения операции поиска по различным каталогам и/ или базам данных будут использоваться форматы Z39.50 и XML. Проблемным может оказаться вопрос получения в составе консорциума лицензии или авторских прав на различного рода электронные ресурсы.

Общественная информация
Деятельность Совета графства Эссекс в Великобритании положила начало разработкам по созданию систем распространения общественной информации. Вместо традиционной централизованной базы данных общественной информации, Essex Online (которая образовалась в ходе работы над проектом «SEAMLESS») использует форматы Z39.50 и Harvest для нахождения нужной информации в базах данных и Web-сайтах сотрудничающих организаций в режиме единого интегрированного поиска, который также известен под названием глубинная интеграция. Свыше 30 местных организаций (советы, университеты и колледжи, представительства фирм, здравоохранительные учреждения, предприятий общественного пользования, редакция местной газеты, волонтерские организации и т.д.) постоянно вносят новые сведения в данную систему, и число поставщиков данной информации быстро увеличивается.
Для того, чтобы система могла осуществлять поиск по данным распределенных информационных баз, партнеры приняли единый набор параметров метаданных основанный на the e-gms, который в свою очередь опирается на формат Dublin Core, а также единый тезаурус для присваивания тематических идентификаторов. Проект Essex недавно получил право на финансирование из средств «Фонда новых возможностей» для создания аналогичной системы на национальном уровне, собирая данных крупных национальных информационных провайдеров, таких как nhsDirect Online, и обеспечивая доступ к использованию данных поисковых систем в следующих 8 регионах, охватывающих 6 миллионов граждан. Более подробную информацию по данному вопросу можно найти на Web-сайте seamlessUK.

Поддержка обучения
Некоторые библиотеки начинают работать в сотрудничестве с другими организациями, колледжами, университетами и т. д., для оказания более качественной помощи учащимся. Обычно сотрудничающие стороны договариваются о предоставлении услуг своих библиотек пользователям партнеров, и по возможности создают единый читательский билет. Часто разрабатываются системы, позволяющие осуществлять одновременный поиск по их совместным каталогам и/ или базам данных (более подробные разъяснения можно найти выше в разделе «Группы сотрудничества»). В число примеров входят: «Схема доступа к библиотекам Сандерленда» (Libraries Access Sunderland scHeme) и «Проект электронной библиотеки г. Глазгоу». (Digital Library Project).

В Великобритании «Комитет объединенного информационного обслуживания» (Joint Information Services Committee (JISC)) разрабатывает проект «Распределенного национального образовательного ресурса» (Distributed National Educational Resource (DNER)), цель которого — предоставление информации и ресурсов для поддержания научных исследования и обучения. Это очень крупный инновационный проект, основанный на идеях «Сети обнаружения ресурсов» (RDN) относительно тематических порталов, лидирующий в сфере предоставления ресурсов в сетевом информационном пространстве.
Многие научные библиотеки также занимаются разработкой комплексной автоматически управляемой или виртуальной образовательной среды (MLEs, VLEs). В Великобритании Департамент Соединенного королевства по библиотечным сетям возглавляет «Группу, занимающуюся вопросами разработки метаданных для системы образования» (Metadata for Education Group (MEG)), цель которой выявить возможности метаданных для организации работы подобных систем. Публичным библиотекам может быть также предоставлена роль для участия в процессе поддержки формального обучения и непрерывного образования.

ПОЛЕЗНЫЕ ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ

Поддерживающие технологии

XML
«Расширяемый язык разметки» (Extensible Mark-up Language (XML)) является приемником формата HTML. Он отличается от предшествующего формата рядом преимуществ, ключевое из которых состоит в том, что он допускает отделение содержания от его представления. Консорциум по системе WWW выпустил краткий обзор, состоящий из десяти пунктов (10 point summary), характеризующих основные особенности формата XML. Более подробную техническую информацию можно найти на сайте xml section of the W3C website или xml.com site. Формату XML в настоящее время посвящается огромное количество разработок и исследований: для ознакомления с информацией по обновленным поисковым инструментам формата XML, таким как xpath, обращайтесь к страницам сайта «Исследовательской группы консорциума WWW по использованию формата XML», W3C XML Query Group. Библиотеки могут рассмотреть переход на формат XHTML. В докладе (report) Департамента Соединенного королевства по библиотечным сетям кратко рассматриваются вопросы совместного использования метаданных и формата XML, включающие их ограниченность и возможности поддержки эффективного совместного использования информации в различных контекстах.

RDF
Формат «Инфраструктуры описания ресурсов» (Resource Description Framework (RDF))позволяет кодировать, обменивать и заново использовать структурированные метаданные, используя XML в качестве альтернативной синтаксической системы. Таким образом, он поддерживает интеграцию его использования в различных областях, от библиотечных и Интернет каталогов до накопления и объединения новостей, программ и различных материалов, а также работе с персональными собраниями музыки, фотографий и других фактов.

Формат RDF позволяет описывать ресурс посредством операторов, как некоторого набора свойств, которые согласовываются с именованной схемой. Операторы записываются в rdf: Описание элементов в формате XML.
Данная причина того, что он обладает таким большим потенциалом, состоит в том, что он накладывает структурные ограничения, которые поддерживают последовательное и недвусмысленное кодирование, а также обмен стандартизованных метаданных, что обеспечивает взаимозаменяемость отдельных пакетов метаданных, определяемых различными сообществами описания ресурсов. в дополнение к этому формат RDF предлагает средство для издания вокабуляров, как воспринимаемых человеком, так и обрабатываемых машиной., предназначенных для стимулирования повторного использования и расширения семантики метаданных среди разрозненных информационных сообществ. Более подробную информацию можно найти во «Введении в формат RDF» (an introduction to RDF). Дескрипторы формата RDF иногда использует библиотеки в качестве некоторой аналогии (analogy). Техническую информацию можно найти на Web-страницах сайта «Консорциума по системе WWW» W3C RDF webpages. «Seamless UK» представляет собой пример общественной информационной системы, которая использует формат RDF для кодирования своих метаданных.

Протокол Z39.50
Z39.50 международный протокол поиска и извлечения информации (ISO 23950, 1998) с помощью которого можно осуществлять поиск (обычно на расстоянии) по разнородным базам данных и выводить информацию через интерфейс пользователя. Z39.50 определяет стандартный путь установления взаимодействия между двумя компьютерами и способствует совместному использованию информации. Предназначенный для поддержки процессов поиска и извлечения информации (полнотекстовых документов, библиографических сведений, изображений, мультимедийных ресурсов), он опирается в своей работе на модель архитектуры клиент-сервер, и с помощью него можно осуществлять полноценную работу в Интернет. Он дает возможность осуществлять поиск в нескольких каталогах и других базах данных за один интегрированный подход. Примечание: До тех пор, пока языки запроса протокола XML не продвинулись в своем развитии дальше, Z39.50 может оставаться предпочитаемым протоколом поиска и извлечения информации для систем предлагающих услуги комплексного распространенного поиска.

«Harvest»
Программа сбора информации, является средством извлечения или сбора информации о метаданных из списка предопределенных сетевых источников, к примеру, Web-станиц организаций, участвующих в проекте. В проекте «Seamless» (Без границ) (см. выше) протокол Harvest создает файл предметно-тематического указателя, в котором система осуществляет поиск в ответ на запрос со стороны пользователя. Затем данные результаты часто интегрируются с результатами поиска протокола Z39.50 и предоставляются пользователю в форме единого списка ссылок. Нажатие на любую из них или открывает соответствующую Web-страницу (собранных с помощью программы Harvest записей) или выводит записи базы данных (для записей протокола Z39.50).

Работа протокола Harvesting лежит в основе деятельности «Инициативы открытых архивов» (Open Archives Initiative (OAI)), которая представляет собой совместный проект, направленный на обеспечение процесса поиска информации в сети посредством разработки и применения стандартов взаимозаменяемости. Он также может быть полезен для Музейного (Museums) сообщества.

Извлечение изображений
До недавних пор изображения приходилось искать на основании словесного описания и введения классификационных кодов, поддерживаемых в ряде случаев пакетами извлечения текстов, предназначенных или специально адаптированных для работы с изображениями. Тезаурус архитектурной тематики (Getty’s AAT (Art and Architecture Thesaurus)) содержит 120000 терминов для описания объектов, текстурных материалов, изображений, архитектуры и материалов культурного наследия. Изображения также можно классифицировать с использованием таки систем как: ICONCLASS, предназначенной для произведений искусства и музейных экспонатов; TELCLASS, для теле- и видеоматериалов, а также системы классификации объектов общественной истории и промышленности для описания объектов музеев.

Более современные системы могут находить и извлекать изображения без необходимости использования его вербального описания.

CBIR (Content Based Image Retrieval — Поиск изображений на основе содержания). Данная протокол не использует систему предметного указателя, состоящего из набора ключевых слов. Изображение извлекается при помощи введения присущих ему самому черт: цвету, текстуре или форме. Относительно технических вопросов различных типов CBIR в настоящее время ведется дискуссия. (discussion). Существуют коммерческие типы CBIR: IBM’s «Поиск на основании содержания изображения» (QBIC (Query by Image Content)). Изображение описывается в терминах цветовых зон и форм, после чего программа по извлечению изображения проводит поиск изображений, отвечающих данному описанию. Нет необходимости указывать точно, что содержит в себе то, или иное изображение. Данные возможности демонстрируются программой поиска изображений (Excalibur’s Image retrieval Ware) , которую можно найти на Web-сайте музея Эрмитаж (Hermitage Museum).

Обсуждение проблемы описания и классификации изображений (на французском языке) можно найти на сайте Cursus. По техническим вопросам относительно способов поиска изображений в настоящее время ведется дискуссия, с материалами которой можно ознакомиться на сайте Diffuse. В ходе данной дискуссии сравниваются способы извлечения изображений «с потерями» и «без потерь»: файлы, который перемещают электронные изображения вместе с его определением являются более громоздкими и медленными чем те, что допускают определенную потерю при сжатии.

ПЛАНЫ НА БУДУЩЕЕ

Семантическая сеть — перспектива описанная в передовой статье журнала «Scientific American» выпуска мая 2001 г. Согласно высказыванию Тима Бернерса-Ли, директора Консорциума WWW: «Семантическая сеть это сеть данных, в некоторой степени, напоминающая всемирную базу данных. Ее создание опирается на идею о том, что цель всемирной сети WWW заключается в оказании полезных услуг не только в процессе коммуникации по модели человек-человек, а с учетом потенциального участия и оказания помощи со стороны машин». Но семантической сети предстоит преодолеть еще значительный путь развития прежде чем, данная мечта преобразуется в реальность. Реализация данной идеи будет осуществляется поэтапно людьми с широкими кругом интересов. Истинный потенциал Семантической сети проявит себя, когда люди создадут много программ, которые смогут собирать материалы Сети из различных источников, обрабатывать данную информацию и обмениваться результатами своих операций с другими программами.
Следующий предвидимый шаг в данном направлении будет заключаться в том, что Семантическая сеть вырвется за пределы виртуального мира и расширит свое влияние на физический мир. Образ оснащенной Web-системой микроволновой печи, запрашивающей совета на сайте производителя замороженных проектов, о том, как наилучшим способом приготовить пищу может быть распространен и на услуги подобного уровня технологического развития, предоставляемых публичными библиотеками, архивами и музеями. Виртуальная картинная рама могла бы, к примеру, давать местному музею или художественной галерее советы относительно идеального подбора картин для выставки, а местная виртуальная публичная библиотека могла бы идеально подобрать и отправить выдаваемую вместе с электронной книгой историю ее создания, в ответ на простую голосовую просьбу о данной услуге. Представление такой картины, конечно же, будоражит воображение людей посещающих или работающих в библиотеке.
Важные понятия, технологии, протоколы и стандарты для разработки Семантической сети (Semantic Web) уже или имеются в наличии, или же находятся на стадии завершения, включая стандарты и протоколы XML RDF и однозначные идентификаторы.

Онтологии. Онтология может определяться как формальное описание объектов и их взаимосвязей. В контексте Семантической сети, цель заключается в наделении машины способностью общаться с другой машиной при ограниченном вмешательстве со стороны человека или полным отсутствием такового. См. Ontoweb и Wonderweb. Все больше появляется полезных с семантической точки зрения подходов к моделированию онтологий, в состав которых входит:

  • Список терминов — неопределенные взаимосвязи
  • Классификационная схема
  • Тезаурусы — родовидовые и ассоциативные связи
  • Тематические карты (Topic maps) — новый стандарт ISO для системы, описывающей структуры определенной области знаний, прикрепляя к ним при этом, информационные ресурсы. они должны стать мощным средством перемещения огромных взаимосвязанных информационных массивов. Вместо дублирования материалов предметно-тематического указателя, тематическая карта обобщает и расширяет их одновременно по многим направлениям.
  • Язык онтологии DAML+Oil — взаимосвязи логического описания.
    Онтологии приобретают все большее значение для систем организации знаний и для разработки Семантической сети, и также применения в системах обработки знаний, например, в области «электронной коммерции» или для описания и организации цифровых музейных коллекций.

Цифровые подписи, ключевой элемент инфраструктуры гарантии безопасности совершения электронных коммерческих операций и установления доверительных отношений также рассматриваются в качестве основного элемента Семантической сети. См. «Индивидуализация обслуживания».

Сетевые услуги являются относительно новым явлением, которое как ожидается, будет интенсивно развиваться в течение ближайших нескольких лет. Они могли бы стать первым основным практическим проявлением мышления, опирающегося на концепцию Семантической сети. Подобные определения могут варьироваться, но сетевые услуги смогут достичь такого уровня применения программного обеспечения, при котором отпадет необходимость знаний о том, кто является пользователем, где он находиться или какой-либо другой информации относительно него. См. Diffuse. В течение последующих нескольких лет возможно будут разработаны услуги, программы которых смогут восприниматься и использоваться компьютерными устройствами пользователей и публичной библиотеки автоматически. Провайдеры услуг внешнего применения (External Application Services Providers (ASPs)) могут предоставлять такие услуги. Сетевые услуги основаны на открытых стандартах Интернет.
Пакет основных стандартов и протоколов для сетевых услуг в настоящее время еще разрабатывается и завершение данного процесса ожидается в пределах 2002 г. В их число (помимо XML) входят:

  • «Язык описания сетевых ресурсов» (Web Services Description Language (WSDL))
  • «Системные реестры универсального описания, обнаружения и интеграции» (Universal Description, Discovery & Integration (UDDI) registries), которые предоставляют информацию о предприятиях делового и другого профиля и их технических интерфейсах.
  • «Протокол доступа к простым объектам» (Simple Object Access Protocol (SOAP)), который позволяет обмениваться структурными сообщениями между программами компьютеров.

Концепция сетевого обслуживания в настоящее время развивается под общим влиянием электронной коммерции. Однако, все-таки появляются потенциально возможные области применения услуг интернет провайдеров общественного сектора. Например, в качестве сетевых услуг публичные библиотеки и провайдеры прикладных услуг могли предложить доступ и использование поисковых интерфейсов.
В будущем мы увидим плоды многочисленных разработок в области поиска информации, по сравнения с которыми, используемые в настоящее время системы покажутся безнадежно устаревшими. Высокотехнологичные адаптированные под индивидуального пользователя роботы-посредники будут осуществлять непрерывный поиск по Интернет, адаптированной для наиболее легкого поиска информации при помощи метаданных, управляемого вокабуляра и однозначных идентификаторов. Они смогут в точности находить необходимый для нас материал, не упуская никакой существенной информации, где бы она не находилась.

ССЫЛКИ

Международные
Стандарты ИФЛА по библиографическому описанию изданий
http://www.ifla.org/VII/s13/pubs/isbd_m0602.pdf

Дания
BibHit
Каталог Интернет ресурсов индексированных с использованием метаданных. Это совместный проект, осуществляемый тремя публичными библиотеками (публичной библиотекой г. Хобро, главной публичной библиотекой г. Аархус и публичной библиотекой г. Силькеборга) и одной научной библиотекой (библиотекой школы бизнеса г. Аархус).
http://www.bibhit.dk/info/english.htm

Финляндия
Библиотека ссылок
Каталог Интернет ресурсов, отобранных и описанных библиотеками в процессе совместных усилий. Содержит свыше 6000 ссылок, организованных согласно финской версии системы десятичной классификации Дьюи (ykl) и опубликованных на двух языках: финском и шведском. Также включает устройство метапоиска, осуществляющее поиск по библиотечным каталогам одновременно с библиотекой ссылок.

http://www.kirjastot.fi/.........languageid=

Германия
Национальная схема индексирования и каталогизирования
Публичные библиотеки Германии приняли данную схему для описания ресурсов: она содержит 25 категорий. Многие пользуются центрально создаваемыми данными, которые все в большей степени предоставляются в онлайновом режиме Национальной библиотекой или крупнейшим поставщиком библиотек, фирмой EKZ г. Рёйтлинген.
http://www.ekz-bibliotheksservice.de/ekz/home.nsf/pages/startseite

Нидерланды
OCLC PICA
Параллельный поиск по центральному каталогу Нидерландов и каталогам различных библиотек осуществляемый одновременно.
http://oclcpica.org/?id=2&ln=uk

Великобритания
«Co-East», кооперация администраций ряда публичных библиотек на востоке Англии
http://www.co-east.net/
Музеи г. Лидс (Leeds Museums), web-сайт предлагающий совершить виртуальный тур по музеям города
http://www.leedslearning.net/.......asp?platform=win
Проект электронной библиотеки г. Глазгоу
http://gdl.cdlr.strath.ac.uk/
Libraries Access Sunderland scheme (Схема доступа к библиотекам г. Сандерленда)
http://www.lash.sunderland.ac.uk/
«seamlessUK» (Великобритания без границ) — система распространения общественной информации.
http://www.seamless-uk.info/

США
Solinet
Членская сеть библиотек работающих в области улучшения доступа к информации, и предоставления своим членам эффективно отвечать потребностям в сфере образования, экономического развития и соответствовать улучшенным качествам жизни людей.
http://www.solinet.net/index.cfm



 

 наверх

Ищите на сайте:

Проект PULMAN-XT
Лого проекта PULMAN
Полезные ресурсы


Редкое издание энциклопедии по истории Российской империи наложенным платежом, книги on-line, книги PDF.