自然语言处理相关数据-互联网词库
发布:可思数据
时间:2019-10-19
数据介绍:
互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
格式说明:
数据格式为
词A 词频 词性1 词性2 … 词性N
词B 词频 词性1 词性2 … 词性N
词C 词频 词性1 词性2 … 词性N
词性说明:
N 名词
V 动词
ADJ 形容词
ADV 副词
CLAS 量词
ECHO 拟声词
STRU 结构助词
AUX 助词
COOR 并列连词
CONJ 连词
SUFFIX 前缀
PREFIX 后缀
PREP 介词
PRON 代词
QUES 疑问词
NUM 数词
IDIOM 成语
下载地址:
特别声明:
¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能交流群扫码邀请
相关文章:
-
无相关信息
相关推荐:
网友评论:
数据集分类
最新数据集
推荐数据集