Описание
Казачкова М. Б., Галимова Х. Н.
Создание лингвистического корпуса учебников английского языка
Аннотация:
В статье рассматриваются основные принципы построения корпуса ранжированных текстов учебников английского языка. Корпус текстов — это компьютерная коллекция текстов, представляющих письменную или устную речь разных сфер функционирования и тематики. Лингвистический корпус состоит из текстов, отобранных из входящих в федеральный перечень школьных учебников российских издательств. Каждый текст находится внутри отдельного документа с присвоенным кодом, включающим в себя: язык, предмет, класс, год обучения, сведения об авторах учебника, номер текста, сферу функционирования, тематику текста, количество словоупотреблений и год издания учебника. На сегодняшний день объем корпуса учебников английского языка составляет 890 текстов и 100 400 словоупотреблений. Благодарность: Работа выполнена за счет средств Программы стратегического академического лидерства Казанского (Приволжского) федерального университета
Ключевые слова:
текст, учебник, английский язык, корпус, корпус-менеджер, метаразметка, словоупотребление

