본문 바로가기

파이썬 통계 머신러닝

df.drop_duplicates(subset=['a'], keep='last') : a 중복값 중 마지막 남기고 다 제거

df.drop_duplicates(subset=['a'], keep='last')

#a 중복값 중 마지막 남기고 다 제거

 

df.drop_duplicates(subset=['a'], keep='first') # default

#a 중복값 중 맨 앞 남기고 다 제거

 

df.drop_duplicates(subset=['a'], keep=False) 

#a 중복값 모두 제거

------------------------------

df.duplicated(['a'])

# 중복 데이터 여부 확인은 duplicated