Создание лингвистического корпуса учебников английского языка (2022)

290

Категория:

Описание

Казачкова М. Б., Галимова Х. Н.
Создание лингвистического корпуса учебников английского языка

Аннотация:
В статье рассматриваются основные принципы построения корпуса ранжированных текстов учебников английского языка. Корпус текстов это компьютерная коллекция текстов, представляющих письменную или устную речь разных сфер функционирования и тематики. Лингвистический корпус состоит из текстов, отобранных из входящих в федеральный перечень школьных учебников российских издательств. Каждый текст находится внутри отдельного документа с присвоенным кодом, включающим в себя: язык, предмет, класс, год обучения, сведения об авторах учебника, номер текста, сферу функционирования, тематику текста, количество словоупотреблений и год издания учебника. На сегодняшний день объем корпуса учебников английского языка составляет 890 текстов и 100 400 словоупотреблений. Благодарность: Работа выполнена за счет средств Программы стратегического академического лидерства Казанского (Приволжского) федерального университета


Ключевые слова:
текст, учебник, английский язык, корпус, корпус-менеджер, метаразметка, словоупотребление