Обновление корпуса и датасета

Опубликован новый релиз Деткорпуса и синхронизированная с ним новая версия датасета (версия 2.0). Мы пополнили подкорпус художественной литературы, преимущественно текстами 1920-х гг. Упростили порядок вывода метаданных в интерфейсе — количество полей теперь сокращено, удалена дублирующаяся информация. Сборники повестей и рассказов были разобраны на отдельные произведения. Общий объем корпуса к настоящему моменту — 2703 произведения.

social