Рады представить подкорпус русскоязычной поэзии, адресованной детям (1910—1929). На данный момент он включает 586 произведений, опубликованных на русском языке в период с 1910 по 1929 год в периодической печати. В основе корпуса коллекция, составленная из материалах популярных детских журналов названного периода (например, Мурзилка, Жаворонок, Светлячок, Тропинка и др.), за …
read moreOther articles
Обновление корпуса и датасета
Опубликован новый релиз Деткорпуса и синхронизированная с ним новая версия датасета (версия 2.0). Мы пополнили подкорпус художественной литературы, преимущественно текстами 1920-х гг. Упростили порядок вывода метаданных в интерфейсе — количество полей теперь сокращено, удалена дублирующаяся информация. Сборники повестей и рассказов были разобраны на отдельные произведения. Общий объем корпуса к настоящему …
read moreНовый подкорпус — критика детской литературы 1918—1940
В ДетКорпусе появился новый подкорпус — полнотекстовый корпус критики детской литературы. ДетКорпус.Критика на данный момент включает 892 статьи, опубликованные на русском языке в период с 1918 по 1940 год в центральной, ведомственной и эмигрантской периодической печати. Это журналы и газеты — «Детская литература», «Книга — детям», «За коммунистическое просвещение», «Литературная газета», «Книга …
read moreДетКорпус.Критика
О корпусе
ДетКорпус.Критика — это аннотированный корпус критики детской литературы (1860—1940 годы). На данный момент он включает 2019 статей, опубликованные на русском языке в период с 1918 по 1940 год в центральной и ведомственной периодической печати. В жанровом отношении корпус состоит из статей, обзоров, рецензий, заметок и других журнальных …
read moreПополнение корпуса и публикация датасета
Важные новости — теперь Деткорпус доступен исследователям не только для онлайн-поиска, но и в качестве датасета, опубликованного в Репозитории открытых данных по литературе и фольклору. Формат и набор данных, включенных в датасет, подобран таким образом, чтобы на этом материале можно было воспроизвести большую часть статистических расчетов, сделанных на исходных текстах корпуса …
read moreЦитирование Деткорпуса
При использовании материалов Деткорпуса в научных публикациях, мы рекомендуем использовать ссылку на актуальную версию датасета в Репозитории открытых данных по литературе и фольклору. Это необходимо для верификации и воспроизведения исследовательских результатов: каждое пополнение Деткорпуса меняет частотности словоупотребления, статистику по авторам, темы LDA и проч. В Репозитории публикуется стабильная версия данных …
read moreДетКорпус как открытые данные
Маслинский, Кирилл; Лекаревич, Евгения; Алейник, Любовь, 2021, Корпус русской прозы для детей и юношества, V2 // Репозиторий открытых данных по русской литературе и фольклору. DOI: 10.31860/openlit-2021.4-C001
ДЕТКОРПУС
Корпус русской прозы для детей и юношества XX—XXI вв. (ДетКорпус) — это аннотированный корпус произведений русской детской литературы. В настоящий момент …
read moreДетство в Сокольниках и Деткорпус
Библиотекари Центральной детской библиотеки им. И.А. Крылова в Сокольниках провели литературно-краеведческое расследование с помощью ДетКорпуса и сделали подборку цитат об образе района Сокольники в детской и юношеской советской прозе с 1940-х до 1970-х гг.. Материал можно посмотреть здесь.
«Детство в Сокольниках» — это онлайн-музей воспоминаний, где библиотекари совместно с местными …
read moreТехническое обновление корпуса
В Деткорпусе были обнаружены недочеты в метаданных и «шум» в данных — мы проверили и внесли исправления более чем в 600 текстов, улучшив поисковую выдачу. Несколько изменился объем корпуса, к настоящему моменту для художественной литературы это 2037 проиндексированных названий произведений, для нон-фикшн — 60; продолжаем совершенствоваться.
read more