Интернет-магазин электроники и бытовой техники

Выполнение 
работ на заказ. Контрольные, курсовые и дипломные работы

Выполнение работ на заказ. Контрольные, курсовые и дипломные работы

Китайские косметические средства

Китайская народная медицина

Копии смартфонов

Духи от Dior

Стильные браслеты с уникальным дизайном

Термос Bullet

Часы Hublot механические

Гироскутер SmartWay

Женский Интим-гель

Нужен оригинальный подарок? Закажи

Локальная сеть Подключение кабелей Волоконнооптические кабели Кабели для локальных сетей Адаптеры Ethernet Скорость передачи данных Информационные технологии

Лабораторные работы по курсу Информационные технологии. Технологии защиты информации

Лингвистические процессоры. 

Системы автоматической обработки текста.

Лингвистические банки данных.

Классификационная схема лингвистических средств представлена на рисунке 21.

1. Информационно-поисковый язык (ИПЯ) – формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. К ИПЯ относятся:

Классификационный ИПЯ.

Предметизационный ИПЯ.

ИПЯ координатного индексирования.

Объектно-признаковые ИПЯ.

 


Рис. 21. Классификация ЛС

Классификационные ИПЯ – средство формализованного представления содержания документа, данных и информационных запросов посредством кодов или описаний классов логически упорядоченного множества понятий:

десятичная классификация Дьюи (ДКД);

универсальная десятичная классификация (УДК);

библиотечно-библиографическая классификация (ББК);

государственный рубрикатор научно-технической информации (ГРНТИ);

международный классификатор изобретений (МКИ).

Вербальный ИПЯ – информационно-поисковый язык, использующий для представления своих лексических единиц слова и выражения естественного языка в их орфографической форме.

К вербальным ИПЯ относятся:

дескрипторный язык, информационно-поисковые тезаурусы;

язык предметных рубрик.

Дескрипторный язык (от англ. слова descriptor – «описатель») – информационно-поисковый язык, предназначенный для координатного индексирования документов и информационных запросов посредством дескрипторов или ключевых слов.

Информационно-поисковый тезаурус («тезаурус» в пер. с греч. «сокровищница», «запас», «клад») – нормативный словарь понятий и классификационных связей между ними (иерархических, т. е. родовидовых, и неиерархических).

2. Языки-идентификаторы

Международные стандартные номера (книг – ISBN, сериальных изданий – ISSN, музыкальных произведений – ISMN и т. д.).

Коды названий (языков, стран, физических величин и т. д.).

Таблица авторских знаков.

Штрих-коды (документов, читателей).

Нормативно-справочная база

Справочные издания (энциклопедии, словари и справочники, которые помогут разобраться в незнакомых терминах, выявить связи предмета с другими предметами, уточнить сущность вопроса.

Нормативные документы (государственные и отраслевые стандарты).

Стандарты по информации, библиотечному и издательскому делу – СИБИД:

ГОСТ 7.1 – 2003. Библиографическое описание документа. Общие требования  и правила составления.

ГОСТ 7.80 – 2000 Библиографическая запись. Заголовок. Общие требования и правила составления.

ГОСТ 7. 82 – 2001 Библиографическая запись. Библиографическое описание электронных ресурсов. Общие требования и правила составления.

4. Методики индексирования (систематизации, предметизации).

Основные принципы общей методики электронной предметизации:

структура предметной рубрики (ПР) и принципы ее построения;

заголовки и подзаголовки ПР;

принципы применения ПР.

Конечный результат предметизации – предметные рубрики различного вида. По широте отражаемой тематики предметные рубрики подразделяются на адекватные и обобщающие.

Адекватные – рубрики, формулировка которых выражает объем понятия, наиболее точно соответствующий объему понятия о предмете документа.

Обобщающая – рубрика, формулировка которой выражает объем понятия, более широкий, чем объем понятия о предмете документа.

Электронная предметизация, сохраняя основные принципы традиционной обработки документа, предоставляет более широкие возможности для раскрытия его содержания. Это связано с тем, что в электронной среде вопрос об объеме термина индексирования перестает быть актуальным. Появляется возможность адекватно отражать содержание документа, не сокращать слова. Если в карточных каталогах библиографические записи традиционно содержат 1–1,5 рубрики, то в машиночитаемых ИПС их число значительно увеличивается, что способствует более точному раскрытию содержания документа.

Предметная рубрика может состоять:

- из одного термина индексирования (одной лексической единицы) – Заголовка;

- из нескольких терминов индексирования (нескольких ЛЕ), объединенных в цепочку в соответствии с правилами синтаксиса, принятыми в системе предметизации (Заголовок с подзаголовками).

Заголовок ПР – это первая лексическая единица многочленной ПР, отделяемая от последующих разделительным знаком. По структуре различают два вида предметных рубрик: простые и сложные.

Простая предметная рубрика – это предметная рубрика, состоящая из одной лексической единицы – Заголовка ПР.

Простая предметная рубрика всегда однозначна и отражает общее понятие о предмете каталогизируемого документа.

Простая предметная рубрика присваивается каталогизируемому документу при предметизации так называемых общих работ, то есть документов, в каждом из которых предмет рассматривается в целом и всесторонне.

Сложная ПР – это ПР, состоящая из нескольких лексических единиц (Заголовка и подзаголовка), отделенных друг от друга разделительными знаками.

Сложная предметная рубрика применяется в нескольких формах:

многочленная ПР;

описательная ПР;

комбинированная ПР.

Основная форма сложной ПР – многочленная ПР, состоящая из нескольких лексических единиц: заголовка ПР и подзаголовков, отделенных друг от друга разделительным знаком.

Описательная ПР – сложная ПР, в которой комбинация лексических единиц, чаще всего отделенных друг от друга предлогами и союзами, представлена в виде единого словосочетания.

По своей формулировке описательные ПР более близки к естественному языку, но использование их при автоматизированной обработки документов нежелательно. Описательные ПР используются в тех случаях, когда их формулировки являются устоявшимися терминами.

Например:

Налог на имущество физических лиц.

Авангардизм в искусстве.

Машин и механизмов теория.

Средства представления данных.

Коммуникативный формат представления библиографических данных (RUSMARC, UNIMARC, MARC21).

Коммуникативный формат представления нормативных/авторитетных данных.

Таким образом, лингвистические средства библиотечной технологии – совокупность компонентов, необходимые для обработки, систематизации, поиска и хранения информации.

Реализация лингвистическими средствами библиотечной технологии одной из важнейших функций библиотеки – обеспечение доступа потребителей информации к информационным ресурсам за счет раскрытия смыслового содержания хранящихся в библиотеке документов средствами соответствующих ИПЯ и методов индексирования. Без адекватных лингвистических средств невозможно проведение ни одного из видов информационного поиска: от элементарного адресного (основанного на языке библиографического описания документа), широкотематического (базирующегося на классификационных ИПЯ), узкотематического, предметного (язык предметных рубрик или дескрипторный ИПЯ), фактографического (связанного с объектно-признаковыми языками, до самого сложного – комплексного, предполагающего использование всего многообразия существующих лингвистических средств.

Контрольные вопросы

Назовите группы средств технологического обеспечения информационных технологий.

Как классифицируются технические средства в разрезе информационных процессов?

Назовите базовые программные средства информационных технологий.

В чем заключаются основные тенденции развития программного обеспечения?

Назовите подходы к определению понятия «лингвистическое обеспечение».

Дайте характеристику лингвистическим средствам информационных технологий.

Программные средства (ПС) информационных технологий – это компьютерные (машинные) программы, представленные на языке программирования или в машинном коде описания действий, которые должна выполнить ЭВМ в соответствии с алгоритмом решения конкретной задачи или группы задач.

 Определение понятия «лингвистическое обеспечение» В литературе по информатике накопилось значительное количество различных подходов к понятию «лингвистическое обеспечение» (далее ЛО) и, соответственно, различных определений этого понятия (или близких понятий «информационно-поисковые языки», «языковые средства АИС» и др.). Кратко рассмотрим основные подходы.

Классификация средств ЛО

Регламентирующие документы Неотъемлемым свойством любых технологий, включая информационные, является их регламентация (нормализация) – установление однозначных требований к процессам, обеспечивающим подсистемам, промежуточным и конечным результатам.


На главную