source

Panda DataFrame을 사전으로 변환

nicesource 2023. 1. 8. 14:35

Panda DataFrame을 사전으로 변환

4컬럼의 Data Frame을 가지고 있습니다.이 Data Frame을 python 사전으로 변환하고 싶습니다.첫 번째 열의 요소는keys같은 행에 있는 다른 열의 요소는values.

데이터 프레임:

    ID   A   B   C
0   p    1   3   2
1   q    4   3   2
2   r    4   0   9

출력은 다음과 같습니다.

사전:

{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}

이 메서드는 열 이름을 사전 키로 설정하므로 DataFrame을 약간 재구성해야 합니다.의 설정ID' 컬럼을 인덱스로 한 후 Data Frame을 변경하는 것도 이를 위한 한 가지 방법입니다.

to_dict()에서는 각 열의 값 목록을 출력하기 위해 필요한 'orient' 인수도 받아들입니다.그렇지 않은 경우 양식 사전{index: value}각 열에 대해 반환됩니다.

이러한 순서는, 다음의 행으로 실행할 수 있습니다.

>>> df.set_index('ID').T.to_dict('list')
{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

다른 사전 형식이 필요한 경우 가능한 오리엔트 인수 예를 다음에 제시하겠습니다.다음과 같은 간단한 Data Frame을 고려합니다.

>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
>>> df
        a      b
0     red  0.500
1  yellow  0.250
2    blue  0.125

그러면 옵션은 다음과 같습니다.

dict - 기본값: 열 이름은 키, 값은 인덱스 사전: 데이터 쌍

>>> df.to_dict('dict')
{'a': {0: 'red', 1: 'yellow', 2: 'blue'}, 
 'b': {0: 0.5, 1: 0.25, 2: 0.125}}

list - 키는 열 이름이고 값은 열 데이터 목록입니다.

>>> df.to_dict('list')
{'a': ['red', 'yellow', 'blue'], 
 'b': [0.5, 0.25, 0.125]}

Series - 'list'와 비슷하지만 값은 Series입니다.

>>> df.to_dict('series')
{'a': 0       red
      1    yellow
      2      blue
      Name: a, dtype: object, 

 'b': 0    0.500
      1    0.250
      2    0.125
      Name: b, dtype: float64}

split - 열/데이터/인덱스를 각각 열 이름, 행 및 인덱스 레이블별 데이터 값으로 키로 분할합니다.

>>> df.to_dict('split')
{'columns': ['a', 'b'],
 'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]],
 'index': [0, 1, 2]}

레코드 - 각 행은 사전이 됩니다.여기서 키는 열 이름이고 값은 셀 내의 데이터입니다.

>>> df.to_dict('records')
[{'a': 'red', 'b': 0.5}, 
 {'a': 'yellow', 'b': 0.25}, 
 {'a': 'blue', 'b': 0.125}]

색인 - 'dex'와 비슷하지만 키가 색인 레이블로 있는 사전(목록이 아닌)

>>> df.to_dict('index')
{0: {'a': 'red', 'b': 0.5},
 1: {'a': 'yellow', 'b': 0.25},
 2: {'a': 'blue', 'b': 0.125}}

사전이 다음과 같은 경우:

{'red': '0.500', 'yellow': '0.250', 'blue': '0.125'}

다음과 같은 데이터 프레임에서 요구됩니다.

        a      b
0     red  0.500
1  yellow  0.250
2    blue  0.125

가장 간단한 방법은 다음과 같습니다.

dict(df.values)

아래 작업 코드 조각:

import pandas as pd
df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
dict(df.values)

사용해보십시오.Zip

df = pd.read_csv("file")
d= dict([(i,[a,b,c ]) for i, a,b,c in zip(df.ID, df.A,df.B,df.C)])
print d

출력:

{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

다음의 순서에 따릅니다.

데이터 프레임은 다음과 같습니다.

>>> df
   A  B  C ID
0  1  3  2  p
1  4  3  2  q
2  4  0  9  r

1. 사용`set_index`세팅하다`ID`컬럼을 데이터 프레임인덱스로 지정합니다.

    df.set_index("ID", drop=True, inplace=True)

2. 를 사용합니다.`orient=index`인덱스를 사전 키로 사용할 수 있습니다.

    dictionary = df.to_dict(orient="index")

결과는 다음과 같습니다.

    >>> dictionary
    {'q': {'A': 4, 'B': 3, 'D': 2}, 'p': {'A': 1, 'B': 3, 'D': 2}, 'r': {'A': 4, 'B': 0, 'D': 9}}

3. 각 샘플을 목록으로 만들어야 할 경우 다음 코드를 실행합니다.열 순서를 결정합니다.

column_order= ["A", "B", "C"] #  Determine your preferred order of columns
d = {} #  Initialize the new dictionary as an empty dictionary
for k in dictionary:
    d[k] = [dictionary[k][column_name] for column_name in column_order]

사전 값이 튜플이 되어도 괜찮다면 반복 배수를 사용할 수 있습니다.

>>> {x[0]: x[1:] for x in df.itertuples(index=False)}
{'p': (1, 3, 2), 'q': (4, 3, 2), 'r': (4, 0, 9)}

저는 (xy 위치를 가진 노드 이름) 가장 유용하고 직관적인 것에 대한 @user4179775의 답변을 찾았습니다.

import pandas as pd

df = pd.read_csv('glycolysis_nodes_xy.tsv', sep='\t')

df.head()
    nodes    x    y
0  c00033  146  958
1  c00031  601  195
...

xy_dict_list=dict([(i,[a,b]) for i, a,b in zip(df.nodes, df.x,df.y)])

xy_dict_list
{'c00022': [483, 868],
 'c00024': [146, 868],
 ... }

xy_dict_tuples=dict([(i,(a,b)) for i, a,b in zip(df.nodes, df.x,df.y)])

xy_dict_tuples
{'c00022': (483, 868),
 'c00024': (146, 868),
 ... }

부록

나는 나중에 다른, 그러나 관련된 일로 이 문제에 대해 다시 이야기했다.여기 [탁월한] 답변에 더 가까운 접근법이 있습니다.

node_df = pd.read_csv('node_prop-glycolysis_tca-from_pg.tsv', sep='\t')

node_df.head()
   node  kegg_id kegg_cid            name  wt  vis
0  22    22       c00022   pyruvate        1   1
1  24    24       c00024   acetyl-CoA      1   1
...

Panda 데이터 프레임을 [list], {dict}, {dict}, ...로 변환합니다.

수락된 답변:

node_df.set_index('kegg_cid').T.to_dict('list')

{'c00022': [22, 22, 'pyruvate', 1, 1],
 'c00024': [24, 24, 'acetyl-CoA', 1, 1],
 ... }

node_df.set_index('kegg_cid').T.to_dict('dict')

{'c00022': {'kegg_id': 22, 'name': 'pyruvate', 'node': 22, 'vis': 1, 'wt': 1},
 'c00024': {'kegg_id': 24, 'name': 'acetyl-CoA', 'node': 24, 'vis': 1, 'wt': 1},
 ... }

제 경우에도 같은 작업을 하고 싶었지만 판다 데이터 프레임에서 선택한 컬럼을 사용하여 컬럼을 잘라야 했습니다.두 가지 접근법이 있습니다.

직접:

(참조: 팬더를 사전으로 변환하여 주요 값에 사용되는 열을 정의합니다.)

node_df.set_index('kegg_cid')[['name', 'wt', 'vis']].T.to_dict('dict')

{'c00022': {'name': 'pyruvate', 'vis': 1, 'wt': 1},
 'c00024': {'name': 'acetyl-CoA', 'vis': 1, 'wt': 1},
 ... }

"간접:" 먼저 Panda 데이터 프레임에서 원하는 열/데이터를 잘라냅니다(다시 두 가지 접근 방식).

node_df_sliced = node_df[['kegg_cid', 'name', 'wt', 'vis']]

또는

node_df_sliced2 = node_df.loc[:, ['kegg_cid', 'name', 'wt', 'vis']]

사전 작성에 사용할 수 있습니다.

node_df_sliced.set_index('kegg_cid').T.to_dict('dict')

{'c00022': {'name': 'pyruvate', 'vis': 1, 'wt': 1},
 'c00024': {'name': 'acetyl-CoA', 'vis': 1, 'wt': 1},
 ... }

대부분의 답변은 ID가 데이터 프레임에 여러 번 존재할 수 있는 상황을 다루지 않습니다..ID는 데이터 프레임에서 복제할 수 .df도 합니다ID:

{k: [g['A'].tolist(), g['B'].tolist(), g['C'].tolist()] for k,g in df.groupby('ID')}

사전 이해와 반복() 메서드를 사용하여 원하는 출력을 얻을 수도 있습니다.

result = {row.ID: [row.A, row.B, row.C] for (index, row) in df.iterrows()}

df = pd.DataFrame([['p',1,3,2], ['q',4,3,2], ['r',4,0,9]], columns=['ID','A','B','C'])
my_dict = {k:list(v) for k,v in zip(df['ID'], df.drop(columns='ID').values)}
print(my_dict)

출력과 함께

{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

이 방법에서는 데이터 프레임의 열이 키가 되고 일련의 데이터 프레임이 값이 됩니다.`

data_dict = dict()
for col in dataframe.columns:
    data_dict[col] = dataframe[col].values.tolist()

DataFrame.to_dict()「DataFrame」(데이터 프레임).

예

>>> df = pd.DataFrame(
    {'col1': [1, 2], 'col2': [0.5, 0.75]}, index=['a', 'b'])
>>> df
   col1  col2
a     1   0.1
b     2   0.2
>>> df.to_dict()
{'col1': {'a': 1, 'b': 2}, 'col2': {'a': 0.5, 'b': 0.75}}

상세한 것에 대하여는, 이 메뉴얼을 참조해 주세요.

언급URL : https://stackoverflow.com/questions/26716616/convert-a-pandas-dataframe-to-a-dictionary

'source' 카테고리의 다른 글

어떤 버전의 Symfony를 가지고 있는지 어떻게 알 수 있습니까? (0)	2023.01.08
문자열 내에서 여분의 공백 제거 (0)	2023.01.08
요소 외부의 클릭을 감지하려면 어떻게 해야 합니까? (0)	2023.01.08
Java 프로그래밍 - SQL 문을 어디에 저장해야 합니까? (0)	2023.01.08
Java 인터페이스의 옵션 메서드 (0)	2023.01.08

현재글Panda DataFrame을 사전으로 변환

각종 프로그래밍 정보를 다루는 블로그입니다.

JSON, mongoDB, MySQL, Python, ASP.NET, WordPress, angularjs, CSS, Powershell, php, Java, oracle, Spring-Boot, Git, C, MariaDB, Android, JavaScript, reactjs, Excel,

Today :
Yesterday :

nicesource

Panda DataFrame을 사전으로 변환

Panda DataFrame을 사전으로 변환

다음의 순서에 따릅니다.

1. 사용`set_index`세팅하다`ID`컬럼을 데이터 프레임인덱스로 지정합니다.

2. 를 사용합니다.`orient=index`인덱스를 사전 키로 사용할 수 있습니다.

3. 각 샘플을 목록으로 만들어야 할 경우 다음 코드를 실행합니다.열 순서를 결정합니다.

'source' 카테고리의 다른 글

'source'의 다른글

티스토리툴바

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Panda DataFrame을 사전으로 변환

Panda DataFrame을 사전으로 변환

다음의 순서에 따릅니다.

1. 사용set_index세팅하다ID컬럼을 데이터 프레임인덱스로 지정합니다.

2. 를 사용합니다.orient=index인덱스를 사전 키로 사용할 수 있습니다.

3. 각 샘플을 목록으로 만들어야 할 경우 다음 코드를 실행합니다.열 순서를 결정합니다.

'source' 카테고리의 다른 글

'source'의 다른글

관련글

티스토리툴바

1. 사용`set_index`세팅하다`ID`컬럼을 데이터 프레임인덱스로 지정합니다.

2. 를 사용합니다.`orient=index`인덱스를 사전 키로 사용할 수 있습니다.