Известия Саратовского университета. Новая серия.

Серия: Филология. Журналистика

ISSN 1817-7115 (Print)
ISSN 2541-898X (Online)


Для цитирования:

Крючкова О. Ю. ЭЛЕКТРОННЫЙ КОРПУС РУССКОЙ ДИАЛЕКТНОЙ РЕЧИ И ПРИНЦИПЫ ЕГО РАЗМЕТКИ // Известия Саратовского университета. Новая серия. Серия: Филология. Журналистика. 2007. Т. 7, вып. 1. С. 30-34. DOI: , EDN:

Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0).
Полный текст в формате PDF(Ru):
(загрузок: 0)
Язык публикации: 
русский
Рубрика: 
Тип статьи: 
Научная статья
УДК: 
808.2-087
DOI: 
EDN: 

ЭЛЕКТРОННЫЙ КОРПУС РУССКОЙ ДИАЛЕКТНОЙ РЕЧИ И ПРИНЦИПЫ ЕГО РАЗМЕТКИ

Авторы: 
Крючкова Ольга Юрьевна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Аннотация: 

B статье освещаются стратегии создания уникального электронного текстового корпуса русской диалектной речи. Автор рассматривает также принципы разметки диалектных текстов.  

Ключевые слова: 
Список источников: 
  1. Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект № — 06-06- 80428-a).
  2. См., напр.: Гольдин В.Е. Теоретические проблемы коммуникативной диалектологии. Саратов, 1997. Он же. Изобразительность диалектной речи // Бюллетень фонетического фонда русского языка. №7.
  3. Тексты устной речи. СПб.. 2000
  4. Демешкина Г.А. Теория диалектного высказывания. Аспекты семантики. Томск. 2000
  5. Иванцова Е.В. Феномен диалектной языковой деятельности. Томск, 2002
  6.  Ростова А.Н. Метатекст как форма экспликации метаязыкового сознания (на материале русских говоров Сибири). Томск. 2000
  7. Гольдин В. Е. К проекту тскстового диалектологического подфонда Машинного фонда русского языка // Докл. Всесоюз. конф. по созданию машинного фонда русского языка. M., 1990.
  8. Проект поддержан Российским фондом фундаментальных исследований.
  9. Летучий А.Б. Корпус диалектных текстов: задачи и проблемы // Национальный корпус русского — языка: 2003-2005. Результаты и перспективы. M., 2005, С.215.
  10. В настоящее время СарДК включает 3 подкорпуса: подкорпус с. Белогорное Вольского района Саратовской области, подкорпус с. Земляные Хутора Аткарского района Саратовской области и подкорпус группы поселений Мегра Вытегорского района Вологодской области. Трудность для последовательного выполнения пословной разметки представляют устойчивые сочетания. смысл которых не выводим непосредственно из значений их компонентов. При сохранении пословной разметки устойчивые сочетания отмечаются специальным индексом, отсылающим к имеющемуся в каждом подкорпусе списку таких сочетаний.
  11. См.: Ляшевская О.Н., Илунгян В.А., Сичинава Д.В. O морфологическом стандарте Национального корпуса русского языка // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М., 2005
  12. Сичинава Д.В. Обработка текстов с грамматической разметкой: инструкция разметчика // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М.. 2005.
  13. О тематической кодировке в НКРЯ см.: Савчук С.О. Метатекстовая разметка в Национальном корпусе русского языка: базовые принципы и основные функции // Национальный корпус русского языка: 2003-2005. Peзультаты и перспективы. M., 2005. Подробнее о тематической разметке см.: Гольдин В. ., Крючкова O.Ю. Тематическая разметка и тематический анализ диалектного текстового корпуса // Языковая личность — текст — дискурс: теоретические и прикладные аспекты исследования: Материалы междунар. науч. конф.: В 2 ч. Самара. 2006. 
Поступила в редакцию: 
24.10.2006
Принята к публикации: 
01.12.2006
Опубликована онлайн: 
20.03.2007
Опубликована: 
20.03.2007