Где взять датасет (данные) содержащий иронию и сарказм?



@inalan

Нигде не нахожу размеченные датасеты для русского языка, содержащие сарказм. Везде обыскал (kaggle итп). Может у кого нибудь есть эти данные или знает где найти?


Решения вопроса 0


Ответы на вопрос 2



@Noizefan

Сам собери, ты же айтишник

___
можно распарсить соц сети (особенно твиттер) по хештегам #sarcasm



@rPman

Дико интересно было бы такую базу собрать
в качестве исходной можно взять дамп пикабу https://pikastat.d3d.info/

ищите по тегам сарказм, смайликам в конце и прочему, но руками выверять придется так или иначе

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *