如何使用Python判斷同一分組下某一變數的值是否相等?

時間 2021-06-10 00:13:51

1樓:夜雨微寒

import

pandas

aspd

# 讀取人口普查資料到dataframe,如果資料量過大,只取family_id, HHNUM這兩列df=

pd.read_sql

()def

family_num_detec

(family_id

):# 篩選指定family_id的家庭人數資訊df_same_id=df

[df['family_id']==

family_id

]same_id_lst

=list

(set

(list

(df_same_id

)))# 正常情況下,same_id_lst只能有乙個元素,否則異常iflen

(same_id_lst)==

1:return

"正常"

else

:return

"異常"df[

'家庭人數異常檢查標記']=

df['family_id'].

(family_num_detec

)"""

經過以上,可以獲取到各個family_id是否異常了,再與資料庫中的人口普查資料進行匹配即可"""

2樓:資料分析與Python

不知道你的資料格式是什麼,如果是dataframe的話,感覺可以先分組,然後求分組後的max\min,再看看這兩個值是否相等吧。data.groupby('ID')['家庭人數'].

max()和data.groupby('ID')['家庭人數'].min()

如何理解「訓練集測試集都是來自於同一分布」這句話?

滴滴滴 統計機器學習觀點認為機器學習模型就是乙個描述訓練資料集分布的概率密度函式,機器學習的模型實際上就代表總體的label分布是什麼樣的。也即下面兩個公式都可表示機器學習模型 Y f x p y x,theta 那麼這時候機器學習的本質就是從訓練資料 樣本點分布估計總體分布。而訓練集對應總體的分布...

如何看待《同一屋簷下》王天奇遲到一分鐘被扣十塊錢,是否合理?

冉千Wendy 我覺得他既然選擇了這家公司就要遵守公司的制度。既然沒有能力改變規則,那就先改變自己。再說這個 遲到一分鐘罰一百塊錢 的規則,王天奇一直在找理由說,這個不合理,這是錯的。但公司的管理與學校的不同。在學校裡,遲到一分鐘和遲到十分鐘基本上是同樣的,在考勤表上反正都是遲到,只扣固定的分值,按...

冬季如何一分鐘起床?

把手機放的離自己遠一些。必須要下床才能關掉,不同時間的鬧鐘設定不同的響鈴。給自己起床的原因,比如要上課了,或者今天早上必須要完成什麼。早點睡,別熬夜。 戴雙 我最近找到乙個好辦法,對我很管用,不知道題主你了 鬧鐘響後,開始玩兒手機遊戲,然後就清醒了。靈感來自於每次玩兒泡泡龍 亞特蘭蒂斯時,精神高度緊...