Natural Language Processing in Russian

non-profit

https://github.com/russianNLP/

RussianNLP

AI & ML interests

NLP, multilingual models, multimodal models

Recent Activity

vmkhlv updated a dataset 13 days ago

RussianNLP/rublimp

vmkhlv updated a dataset 13 days ago

RussianNLP/coat

vmkhlv authored a paper about 1 month ago

Small Languages, Big Models: A Study of Continual Training on Languages of Norway

View all activity

RussianNLP's activity

vmkhlv

updated 2 datasets 13 days ago

RussianNLP/rublimp

Viewer • Updated 13 days ago • 45k • 275 • 4

RussianNLP/coat

Viewer • Updated 13 days ago • 491k • 265 • 2

vmkhlv

authored 5 papers about 1 month ago

Small Languages, Big Models: A Study of Continual Training on Languages of Norway

Paper • 2412.06484 • Published Dec 9, 2024

Benchmarking Abstractive Summarisation: A Dataset of Human-authored Summaries of Norwegian News Articles

Paper • 2501.07718 • Published Jan 13

A Collection of Question Answering Datasets for Norwegian

Paper • 2501.11128 • Published Jan 19

Beemo: Benchmark of Expert-edited Machine-generated Outputs

Paper • 2411.04032 • Published Nov 6, 2024

An Expanded Massive Multilingual Dataset for High-Performance Language Technologies

Paper • 2503.10267 • Published Mar 13

apugachev

updated a dataset about 2 months ago

RussianNLP/repa

Viewer • Updated Mar 18 • 3.01k • 35 • 1

apugachev

published a dataset about 2 months ago

RussianNLP/repa

Viewer • Updated Mar 18 • 3.01k • 35 • 1

Shavrina

authored 6 papers 3 months ago

A Family of Pretrained Transformer Language Models for Russian

Paper • 2309.10931 • Published Sep 19, 2023 • 5

RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark

Paper • 2010.15925 • Published Oct 29, 2020

Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP models

Paper • 2202.07791 • Published Feb 15, 2022

Findings of the The RuATD Shared Task 2022 on Artificial Text Detection in Russian

Paper • 2206.01583 • Published Jun 3, 2022 • 1

Vote'n'Rank: Revision of Benchmarking with Social Choice Theory

Paper • 2210.05769 • Published Oct 11, 2022

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published Feb 20 • 192

mryab

authored a paper 4 months ago

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published Jan 14 • 63

vmkhlv

authored a paper 5 months ago

The Impact of Copyrighted Material on Large Language Models: A Norwegian Perspective

Paper • 2412.09460 • Published Dec 12, 2024 • 8

averoo

posted an update 5 months ago

Post

854

Just updated the cozy HF Daily Papers review page.

➕ Affiliations extraction (filters are coming soon)
➕ Redesign
➕ Top by month page
🔄 Syncing every 1 hour

👉 https://hfday.ru

Your feedback is appreciated.

2 replies

·

mryab

authored a paper 6 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

Anonumous

in RussianNLP/FRED-T5-Summarizer 6 months ago

Specify the degree of summarization

#2 opened 6 months ago by