python pandas groupby apply 正则表达式

1.创建DataFrame（有a和b两个人,各录入了两次信息。其中，a第一次录入了的性别是男，第2次没有录入性别；b第1次是男，第二次是女。）df=pd.DataFram... 1. 创建DataFrame（有a和b两个人,各录入了两次信息。其中，a第一次录入了的性别是男，第2次没有录入性别；b第1次是男，第二次是女。）
df = pd.DataFrame({'姓名': ['a','a','b','b'], '性别': ['男',np.nan,'男','女']})
2. 按姓名进行Groupbygroup = df.groupby('姓名')
3. 我的问题是：我想按如下规则确定a和b的性别。
4. 规则是：
4.1 假如两次录入都没录入性别(也就是np.nan)，那么他的性别就是np.nan
4.2 假如有一次录入了男或者女，另一次没录入性别，那么他的性别就对应是男或者是女
4.3 假如两次都录入信息，第一次录入的性别和第二次不一样，那么我就随便取男女
4.4 假如两次都录入信息，并且两次录入的性别都一样，那么就按他录入的。
5. 用GroupBy.apply（）方法应该怎么写呢？类似于apply(lambda x: ..........)这样。谢谢！展开

 我来答

2个回答

#热议# 在购买新能源车时，要注意哪些？

jjdsjeff
2019-01-18 · TA获得超过2052个赞

知道大有可为答主

回答量：2470

采纳率：72%

帮助的人：543万

我也去答题访问个人页

关注

展开全部

如果不用groupby

如果一定要用

更多追问追答
追问

第一种方法不好哦，假如b第一次的性别是np.nan，第二次是男，那么用第一种方法就会得到np.nan，而显然得到‘男’更合理。
第二种方法，我大概看懂了，意思就是把不是np.nan的都存起来，然后取第一个，但是假如某个人好几次都不输入性别，也就是说他的性别都是np.nan，那么用[y for...][0]这句就会下标越界错误。
追答

df.groupby('姓名').apply(lambda x:[y if y in list('男女') else np.nan for y in x.性别][0])
追问

嗯这个最好，解决了我的问题。嘿嘿，谢谢！
但是有没有办法改进成更加通用一点的语句。因为这个地方性别只有男女和np.nan3中情况，所以用 if y in list['男女']就可以了。假如我还有个字段是这些人的注册地，那么他可以有'中国'、'日本'、'上海'、'南京'、np.nan等多种字符串和np.nan的组合情况，显然用list罗列有点力不从心啊，那该怎么优化一下呢？
追答
刚才那个有错误


追问

这个好像不对啊，map(str,x.性别)的作用是都变成str ？ 那么np.nan就变成了字符串'nan'了啊。我在你刚才那个基础上这样写的：
group.apply(lambda x: [y if isinstance(y,str) else np.nan for y in x.性别][0])
追答


追问

对哦，sort_values默认吧np.nan放最后。厉害。谢谢了。追加50分。

本回答被提问者采纳

已赞过 已踩过<

评论收起

北京月之暗面科技有限公司

广告2025-01-18

写作_选Kimi_一键生成海量文章_编程、翻译、聊天、语音样样全能_产出效率惊人的免费AI智能尽在Kimi~

kimi.moonshot.cn

wodesitanfu
2019-01-18 · TA获得超过2235个赞

知道大有可为答主

回答量：1908

采纳率：80%

帮助的人：899万

我也去答题访问个人页

关注

展开全部

要group by哪个字段？进行什么聚合操作？

追问

group = groupby[by='姓名']
group['性别'].apply(.......)
就是按照我那个规则返回性别，类型str
规则简单点说就是某个人对应的多个性别里面，假如出现男或者女，就任意取，只要不是np.nan就好；假如性别字段一直是np.nan，就取np.nan

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

熊猫办公表达式-全新技术-3分钟快速创作内容

表达式，领先的AI写作工具，提升写作速度，优化创作模式，自动生成内容，更高效快速!熊猫办公表达式，全新AI技术，更快更全，一键生成文档内容。

www.tukuppt.com广告

正则表达式 |标准版-资料文档库-全文阅读下载

正则表达式 |专题资料下载，不用四处查资料，360文库海量精选正则表达式 |全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com广告

模板与范例模板与范例AI解析，高效又专业

kimi智能助手AI解析模板与范例，帮助快速掌握知识点，效率更高!

kimi.moonshot.cn广告

python pandas groupby apply 正则表达式

您可能关注的内容

其他类似问题

为你推荐：