반응형

DataFrame 2

Pandas Dataframe / Numpy 배열 "축" 정의의 모호성

Pandas Dataframe / Numpy 배열 "축" 정의의 모호성 python 축이 어떻게 정의되는지, 그리고 그것들이 DataFrame의 행 또는 열을 참조하는지에 대해 매우 혼란스러웠습니다.아래의 코드를 생각해 보십시오. >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 그래서 우리가 전화를.df.mean(axis=1), 각 행에 걸쳐 평균을 구합니다. >>> df.mean(axis=1) 0 1 1 2 2 3 하지만 우리가 전화를 하면df.drop(nam..

source 2023.10.21

두 열 A,B를 기준으로 데이터 프레임에서 중복 제거, 다른 열 C에 최대값이 있는 행 유지

두 열 A,B를 기준으로 데이터 프레임에서 중복 제거, 다른 열 C에 최대값이 있는 행 유지 두 열(A 및 B)에 따라 중복된 값을 포함하는 팬더 데이터 프레임이 있습니다. A B C 1 2 1 1 2 4 2 7 1 3 4 0 3 4 8 C열에 최대값이 있는 행을 유지하는 중복을 제거하고 싶습니다.이를 통해 다음을 얻을 수 있습니다. A B C 1 2 4 2 7 1 3 4 8 저는 그것을 어떻게 하는지 모르겠어요.사용할까요?drop_duplicates(), 다른 거?다음 방법으로 그룹을 사용하여 작업할 수 있습니다. c_maxes = df.groupby(['A', 'B']).C.transform(max) df = df.loc[df.C == c_maxes] c_maxes가Series의 최댓값의C각 그룹에서..

source 2023.10.11
반응형