Other articles


  1. Поэтический подкорупус

    Рады представить подкорпус русскоязычной поэзии, адресованной детям (1910—1929). На данный момент он включает 586 произведений, опубликованных на русском языке в период с 1910 по 1929 год в периодической печати. В основе корпуса коллекция, составленная из материалах популярных детских журналов названного периода (например, Мурзилка, Жаворонок, Светлячок, Тропинка и др.), за …

    read more
  2. Обновление корпуса и датасета

    Опубликован новый релиз Деткорпуса и синхронизированная с ним новая версия датасета (версия 2.0). Мы пополнили подкорпус художественной литературы, преимущественно текстами 1920-х гг. Упростили порядок вывода метаданных в интерфейсе — количество полей теперь сокращено, удалена дублирующаяся информация. Сборники повестей и рассказов были разобраны на отдельные произведения. Общий объем корпуса к настоящему …

    read more
  3. Новый подкорпус — критика детской литературы 1918—1940

    В ДетКорпусе появился новый подкорпус — полнотекстовый корпус критики детской литературы. ДетКорпус.Критика на данный момент включает 892 статьи, опубликованные на русском языке в период с 1918 по 1940 год в центральной, ведомственной и эмигрантской периодической печати. Это журналы и газеты — «Детская литература», «Книга — детям», «За коммунистическое просвещение», «Литературная газета», «Книга …

    read more
  4. Пополнение корпуса и публикация датасета

    Важные новости — теперь Деткорпус доступен исследователям не только для онлайн-поиска, но и в качестве датасета, опубликованного в Репозитории открытых данных по литературе и фольклору. Формат и набор данных, включенных в датасет, подобран таким образом, чтобы на этом материале можно было воспроизвести большую часть статистических расчетов, сделанных на исходных текстах корпуса …

    read more
  5. Техническое обновление корпуса

    В Деткорпусе были обнаружены недочеты в метаданных и «шум» в данных — мы проверили и внесли исправления более чем в 600 текстов, улучшив поисковую выдачу. Несколько изменился объем корпуса, к настоящему моменту для художественной литературы это 2037 проиндексированных названий произведений, для нон-фикшн — 60; продолжаем совершенствоваться.

    read more
  6. На пути к балансировке корпуса: 1920-е и 1930-е

    Мы подготовили небольшое обновление корпуса, призванное заполнить некоторые лакуны в выборке и улучшить балансировку корпуса. Подкорпус художественной прозы пополнен произведениями 1920-х и 1930-х годов из учтенных в указателе «Детская литература». Всего добавлено 145 произведений, исправлено несколько ошибок и неточностей. Объем корпуса к настоящему моменту — 2136 произведений.

    read more
  7. Разделение корпусов и русскоязычный интерфейс

    Новый релиз Деткорпуса содержит существенные обновления сразу в нескольких направлениях. Изменилась структура: теперь познавательная (нон-фикшн) и художественная литература для детей представляют собой два разных корпуса, переключаться между коллекциями текстов можно со страницы выбора корпуса.

    Интерфейс корпуса переведен на русский язык — пользователям стали доступны всплывающие подсказки, поясняющие работу корпусных инструментов, а …

    read more
  8. Пополнение корпуса и обновление интерфейса

    В Деткорпус добавлено более сотни произведений 1940х—2000х гг. В разделе нон-фикшн появился новый для Деткорпуса жанр — добавлены популярные тематические энциклопедии для детей: 44 текста 1990—2010х гг. (жанровая метка — encyclopedia). Новый подкорпус пригодится исследователям учебных текстов и просто любознательным пользователям корпуса, например, в нем теперь есть 12 упоминаний коронавируса …

    read more
  9. Пополнение корпуса — советская проза

    Обновление: корпус пополнился сотней прозаических текстов 1920х—1980х годов (общим объемом около 4.5 млн слов). Основное внимание уделено периоду 1970-х — 1980-х, пока еще недостаточно полно представленному в нашем корпусе. В связи с расширением жанрового разнообразия корпуса введены новые жанровые метки:

    • animalistic (анималистическая проза),
    • historical (историческая проза).

    Как и прочие …

    read more

social