注:1、样本来源于国外网络采集,为txt格式2、己除重3、由于是从千万级数据中筛选可能会出现邮箱(也有可能密码本身就是邮箱)
36 万多条,带情感标注 新浪微博,包含 4 种情感,其中喜悦约 20 万条,愤怒、厌恶、低落各约 5 万条
注:来源与网络采集,为txt格式2300万个mail邮箱地址适合外贸营销以gmail、yahoo、hotmail为主
全国五级(省、市、县、乡、村)行政区经度维度边界数据kml格式,可以用rar解压出xml格式后用,也可以直接导入GoogleEarth(谷哥地球)
共收录了372个小说网站的称和网址,并经过测试,目前都可以用
52 万件商品,1100 多个类目,142 万用户,720 万条评论/评分数据