我有一个带有两个字段的 pd 数据框: DBA 名称 (设施名称) 和许可证 #。DBA 名称有多个列表,有些列表具有相同的许可证,而另一些列表则没有。
我想知道所有 DBA 名字有多少个实例。我还想知道他们每个人都有多少个唯一的许可证。
我尝试使用 value _ count (),但是这只适用于 pandas df 中的一个字段。我也尝试使用 apply (),但这并不奏效。
我在下面展示了示例代码。请把你的想法告诉我。
Data = data [['dba name','license #']]
数据:
DBA 名称许可证 #
1 忙碌的大黄蜂学院日托中心 2215472.0
2 忙碌的大黄蜂学院日托 3793.0
3 忙碌的大黄蜂学院日托 2215472.0
4 忙碌的大黄蜂学院日托 1194190.0
5 忙碌的大黄蜂学院日托 2215472.0
6 忙碌的大黄蜂学院日托 1194190.0
7 忙碌的大黄蜂学院日托 1194190.0
8 忙碌的大黄蜂学院日托 3793.0
9 忙碌的大黄蜂学院日托 3793.0
10 瓶到图书学习中心 1943545.0
11 瓶到图书学习中心 1943545.0
12 瓶到图书学习中心 1926534.0
13 瓶到图书学习中心 1926534.0
14 瓶到图书学习中心 1926534.0
15 瓶到图书学习中心 1943545.0
16 瓶到图书学习中心 1926534.0
17 瓶到图书学习中心 1943545.0
18 儿童世界早教中心 1357825.0
19 儿童世界早教中心 1357825.0
20 儿童世界早教中心 1768092.0
21 儿童世界早教中心 1768092.0
22 儿童世界早教中心 1357825.0
23 儿童世界早教中心 1768092.0
24 A 儿童世界早教中心 1357825.0
使用pd.DataFrame.groupby
with nunique
and agg
:
进口熊猫作为 pd
Agg ({'dba name': 'count','license #': 'nunique'})
输出:
DBA 名称许可证 #
DBA 姓名
儿童世界早教中心 7 2
8 2 瓶到书学习中心
忙碌的大黄蜂学院日托中心