TUMCC
TUMCC Telegram地下市场中文语料库一个专业术语识别领域的中文语料库,共收集了来自12 个Telegram 群组19821 位Telegram 用户的28749 个句子,包括804,971 个字符,发布前也完成了数据筛选和分词工作,所以使用起来比较方便,而且还有整理后的版本,有需要的可以到GitHub上面学习。
Telegram地下市场中文语料库
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
TUMCC Telegram地下市场中文语料库一个专业术语识别领域的中文语料库,共收集了来自12 个Telegram 群组19821 位Telegram 用户的28749 个句子,包括804,971 个字符,发布前也完成了数据筛选和分词工作,所以使用起来比较方便,而且还有整理后的版本,有需要的可以到GitHub上面学习。
暂无评论内容