需要帮助从多个 pandas 列中计算唯一值

共1个回答,已解决, 标签: python pandas

我有一个带有两个字段的 pd 数据框: DBA 名称 (设施名称) 和许可证 #。DBA 名称有多个列表,有些列表具有相同的许可证,而另一些列表则没有。

我想知道所有 DBA 名字有多少个实例。我还想知道他们每个人都有多少个唯一的许可证。

我尝试使用 value _ count (),但是这只适用于 pandas df 中的一个字段。我也尝试使用 apply (),但这并不奏效。

我在下面展示了示例代码。请把你的想法告诉我。


Data = data [['dba name','license #']]

数据:
DBA 名称许可证 #
1 忙碌的大黄蜂学院日托中心 2215472.0
2 忙碌的大黄蜂学院日托 3793.0
3 忙碌的大黄蜂学院日托 2215472.0
4 忙碌的大黄蜂学院日托 1194190.0
5 忙碌的大黄蜂学院日托 2215472.0
6 忙碌的大黄蜂学院日托 1194190.0
7 忙碌的大黄蜂学院日托 1194190.0
8 忙碌的大黄蜂学院日托 3793.0
9 忙碌的大黄蜂学院日托 3793.0
10 瓶到图书学习中心 1943545.0
11 瓶到图书学习中心 1943545.0
12 瓶到图书学习中心 1926534.0
13 瓶到图书学习中心 1926534.0
14 瓶到图书学习中心 1926534.0
15 瓶到图书学习中心 1943545.0
16 瓶到图书学习中心 1926534.0
17 瓶到图书学习中心 1943545.0
18 儿童世界早教中心 1357825.0
19 儿童世界早教中心 1357825.0
20 儿童世界早教中心 1768092.0
21 儿童世界早教中心 1768092.0
22 儿童世界早教中心 1357825.0
23 儿童世界早教中心 1768092.0
24 A 儿童世界早教中心 1357825.0

第1个答案(采用)

使用pd.DataFrame.groupby with nunique and agg:

进口熊猫作为 pd

Agg ({'dba name': 'count','license #': 'nunique'})

输出:

DBA 名称许可证 #
DBA 姓名
儿童世界早教中心 7 2
8 2 瓶到书学习中心
忙碌的大黄蜂学院日托中心

相关问题

通过随机抽样其他列数据创建新列 如何使用熊猫获得包括每一个组合的计数 如何有效地展开矩阵的值与小块? 如何破坏 Python 对象并释放内存 将具有特殊格式的文本文档转换为熊猫数据框架 用两本字典绘制一只熊猫专栏图