source

판다 데이터 프레임에서 str.contains 사용

nicesource 2023. 6. 18. 16:06
반응형

판다 데이터 프레임에서 str.contains 사용

이 판다 파이썬 코드는 오류 메시지를 생성합니다.

"TypeError: 단항 ~: 'float'에 대한 잘못된 피연산자 유형"

왜 그런지 모르겠어요 왜냐면 제가 괴물을 조종하려고 하니까요

df_Anomalous_Vendor_Reasons[~df_Anomalous_Vendor_Reasons['V'].str.contains("File*|registry*")] #sorts, leaving only cases where reason is NOT File or Registry

아이디어 있는 사람?

위의 Davtho 1983 논평에 대한 공로를 인정합니다, 저는 명확성을 위해 논평에 색상을 추가할 것이라고 생각했습니다.

나중에 (나처럼) 같은 오류로 인해 이 문제에 걸려 넘어진 사람에게.아주 간단한 해결책입니다.판다의 문서는 다음과 같이 보여줍니다.

Series.str.contains(pat, case=True, flags=0, na=nan, regex=True)

contains() 메서드가 데이터 프레임의 na 값에 적용되지 않고 na로 유지됩니다.na 값을 부울 값으로 채우기만 하면 반전 연산자를 사용할 수 있습니다.~.

위의 예에서는 다음을 사용해야 합니다.

df_Anomalous_Vendor_Reasons[~df_Anomalous_Vendor_Reasons['V'].str.contains("File*|registry*", na=False)]

물론 의도된 논리에 따라 na 인수에 대해 False 또는 True를 선택해야 합니다.na를 채우기 위해 선택한 부울 값은 반전됩니다.

언급URL : https://stackoverflow.com/questions/31745509/using-str-contains-on-pandas-dataframe

반응형