Общая и компьютерная лексикография: проектное обучение

Цели и задачи дисциплины
Целью курса "Общая и компьютерная лексикография: проектное обучение" является cоставление словарей (глоссариев) концептуально-маркированной лексики, взятой из русскоязычного корпуса исторических текстов и создание прототипа цифрового редактора, поддерживающего проведение историко-культурных исследований методами корпусной лингвистики. Для достижения этой цели необходимо решить следующие задачи: 1) собрать коллекцию (корпус) русскоязычных исторических текстов с фокусом на Челябинск и уральский регион; 2) определить модели метаразметки исторических текстов и схемы концептуальной разметки единиц кодирования в текстах (совместно с историками); 3) провести концептуальную разметку единиц кодирования (слов, словосочетаний) в текстах; 4) создать и применить компьютерный инструментарий для построения глоссариев концептуально-размеченной лексики на базе корпуса. 5) провести семантический и структурный анализ словарей (глоссариев) в сопоставлении по различным лексикографическим параметрам. 6) создание цифрового ресурса, поддерживающего проведение историко-культурных исследований методами корпусной лингвистики.
Краткое содержание дисциплины
Обсуждение и работа над следующими блоками: 1) Сбор корпуса русскоязычных исторических текстов с фокусом на Челябинск и уральский регион. 2) Создание модели метаразметки исторических текстов и схемы концептуальной разметки единиц кодирования в текстах. 3) Проведение концептуальной разметки единиц кодирования (слов, словосочетаний) в текстах. 4) Создание и применение компьютерного инструментария для построения глоссариев концептуально-размеченной лексики на базе корпуса. 5) Проведение семантического и структурного анализа словарей (глоссариев) в сопоставлении по различным лексикографическим параметрам. 6) Создание цифрового ресурса.
Компетенции обучающегося, формируемые в результате освоения дисциплины
Выпускник должен обладать:
  • ПК-4 Владеет принципами создания цифровых языковых ресурсов (текстовых, речевых и мультимодальных корпусов; словарей, тезаурусов, онтологий; фонетических, лексических, грамматических и иных баз данных и баз знаний интеллектуальных систем) и умеет использовать такие ресурсы как источник лингвистических данных
Вы нашли ошибку в тексте:
Просто нажмите кнопку «Сообщить об ошибке» — этого достаточно. Также вы можете добавить комментарий.