
关于KDD CUP 99数据集,请问如何把下载的数据导入sql,如何去除重复记录,编码等?
1个回答
展开全部
简单 SELECT DISTINCT * INTO newtable FROM 有重复记录的表
之后在NEWTALBE里面就是没有重复记录的表了.
然后删除有重复记录的表,然后把newtable名字改成之前的名字就好了.
之后在NEWTALBE里面就是没有重复记录的表了.
然后删除有重复记录的表,然后把newtable名字改成之前的名字就好了.
更多追问追答
追问
下载的是一个没有后缀的文件,原本是一个.gz的压缩文件包,怎么导进去啊?您能否详细一些?
追答
额...你是C4的咩/.?? 解压的 导入进去就好了. 如果可以把把文件发给我看看,过期的也行.主要我看看格式.我这边跟你情况差不多.也是很多GZ的文件包,需要进行导入.
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询