python中怎么对dataframe列去重

 我来答
育知同创教育
2017-11-12 · 百度知道合伙人官方认证企业
育知同创教育
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
展开全部

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

[python] view plain copy

  • from pandas import Series, DataFrame  

  • data = DataFrame({'k': [1, 1, 2, 2]})  

  • print data  

  • IsDuplicated = data.duplicated()  

  • print IsDuplicated  

  • print type(IsDuplicated)  

  • data = data.drop_duplicates()  

  • print data  


  • 执行结果是:

    [python] view plain copy

  • k  

  • 0  1  

  • 1  1  

  • 2  2  

  • 3  2  

  • [python] view plain copy

  • 0    False  

  • 1     True  

  • 2    False  

  • 3     True  

  • [python] view plain copy

  • k  

  • 0  1  

  • 2  2  



  • DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

    而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

    这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

    例如,希望对名字为k2的列进行去重,

    data.drop_duplicates(['k2'])

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式