ISO 24613-4-2021 PDF
Название на английском:
St ISO 24613-4-2021
Название на русском:
Ст ISO 24613-4-2021
Оригинальный стандарт ISO 24613-4-2021 в PDF полная версия. Дополнительная инфо + превью по запросу
Полное наименование и описание
ISO 24613-4:2021 — Управление языковыми ресурсами. Каркас разметки лексикона (LMF). Часть 4: Сериализация в формате TEI. Документ описывает XML-сериализацию модели LMF в соответствии с рекомендациями Text Encoding Initiative (TEI), покрывая классы, определённые в частях ISO 24613-1, ISO 24613-2 и ISO 24613-3.
Аннотация
Стандарт задаёт правила представления лексикографических данных и элементов LMF в терминах TEI (теги, атрибуты, структуры), обеспечивая взаимную совместимость и обмен между системами, использующими LMF и TEI. Сериализация охватывает ядро LMF, модель машинно-читаемых словарей (MRD) и этимологические расширения.
Общая информация
- Статус: Публикуется как действующий международный стандарт (Published).
- Дата публикации: 2021 (январь 2021; дата закрепления в источниках — середина января 2021).
- Организация-издатель: Международная организация по стандартизации (ISO); подготовлен техническим комитетом ISO/TC 37/SC 4.
- ICS / категории: 01.020 — Терминология (принципы и координация).
- Редакция / версия: Издание 1 (2021).
- Количество страниц: порядка 20 страниц (официальное число страниц в публикации ISO — 20).
Область применения
Стандарт предназначен для разработчиков и пользователей лексических ресурсов, которым нужно сериализовать модели LMF в формате, совместимом с TEI. Он применим для обмена словарными и лексикографическими данными, миграции существующих словарных ресурсов к TEI-совместимым представлениям, интеграции MRD и этимологических данных, а также для поддержки инструментов цифровой гуманитаристики и NLP, работающих с TEI-корпусами.
Ключевые темы и требования
- Правила соответствия (mapping) сущностей и классов LMF элементам и структурам TEI.
- Рекомендации по оформлению XML-атрибутов, идентификаторов и связей между лексическими единицами.
- Поддержка классов из частей 1 (ядро), 2 (MRD) и 3 (етимология) LMF.
- Требования к интероперабельности и сохранению семантики при трансформации между LMF и TEI.
- Рамки для расширения и локальных адаптаций внутри TEI-профиля при сохранении совместимости.
Применение и пользователи
Основные пользователи — лексикографы, языкотехнические специалисты, разработчики NLP-приложений, хранители цифровых коллекций, исследователи в цифровых гуманитарных науках и сообщества TEI. Стандарт удобен при создании и обмене машинно-читаемых словарей, при подготовке ресурсов для морфологических/семантических аннотаций и при интеграции этимологических данных.
Связанные стандарты
ISO 24613-4 является частью серии ISO 24613 (LMF). Тесно связан с ISO 24613-1 (LMF — ядро), ISO 24613-2 (MRD — модель машинно-читаемых словарей) и ISO 24613-3 (етимологическое расширение). Эта часть заменяет/дополняет прежнюю единичную версию ISO 24613:2008 как обновление, разделённое на части.
Ключевые слова
LMF, TEI, сериализация, лексикографические данные, машинно-читаемый словарь, MRD, этимология, XML, интероперабельность, ISO 24613.
FAQ
В: Что это за стандарт?
О: Международный стандарт, задающий правила представления элементов модели LMF в терминах TEI для сериализации лексических ресурсов и словарей.
В: Что он регулирует?
О: Формат и соответствия между конструкциями LMF и элементами TEI — теги, атрибуты, структура XML, рекомендации по идентификации и связям между лексическими записями, включая MRD и этимологические сведения.
В: Кто обычно использует?
О: Лексикографические издательства, разработчики лингвистических инструментов, научные проекты по цифровым словарям и корпусам, сообщества TEI и специалисты по NLP.
В: Он актуален или заменён?
О: На момент публикации (январь 2021) документ опубликован как действующий стандарт; он является частью переработанной серии ISO 24613 и заменяет прежнюю единичную версию ISO 24613:2008 в том виде, что работа по LMF теперь разделена на части и обновлена. ISO‑нормы подвергаются систематическому пересмотру (обычно каждые 5 лет).
В: Это часть серии?
О: Да — это часть серии ISO 24613: часть 1 (ядро LMF), часть 2 (MRD), часть 3 (етимология) и часть 4 (TEI‑сериализация). Стандарт обеспечивает связующее звено между моделью LMF и TEI-представлением.
В: Какие ключевые слова?
О: LMF, TEI, XML, сериализация, лексикография, MRD, этимология, интероперабельность, ISO 24613.