콘솔워크

[Python dataframe] Union and Union ALL 본문

프로그래밍/python

[Python dataframe] Union and Union ALL

콘솔워크 2021. 1. 15. 14:51
반응형

pandas의 두 데이터 프레임을 모두 결합하는 것은 concat () 함수를 사용하여 간단한 원형 교차로 방식으로 수행됩니다. pandas의 합집합 기능은 합집합과 비슷하지만 중복을 제거합니다. 팬더의 합집합은 concat () 및 drop_duplicates () 함수를 사용하여 수행됩니다. 예를 들어 설명하면 명확해질 것입니다. Pandas dataframe python에서 Union과 Union을 모두 사용하는 방법을 살펴 보겠습니다.Pandas 데이터 프레임 Python에서 모두 통합 및 통합 :

concat () 함수를 사용하여 팬더의 두 데이터 프레임을 모두 쉽게 통합 할 수 있습니다. 예를 들어 보겠습니다. 먼저 두 개의 데이터 프레임을 만듭니다.

 

 

df1은

df2는

import pandas as pd
import numpy as np

#Create a DataFrame

df1 = {
   'Subject':['semester1','semester2','semester3','semester4','semester1',
               'semester2','semester3'],
   'Score':[62,47,55,74,31,77,85]}

df2 = {
   'Subject':['semester1','semester2','semester3','semester4'],
   'Score':[90,47,85,74]}

df1 = pd.DataFrame(df1,columns=['Subject','Score'])
df2 = pd.DataFrame(df2,columns=['Subject','Score'])

 

Pandas의 모든 데이터 프레임을 통합합니다.

UNION ALL

pandas의 concat () 함수는 두 데이터 프레임의 합집합을 만듭니다.

두 데이터 프레임 df1 및 df2 모두를 결합하여 중복으로 생성됩니다. 따라서 결과 데이터 프레임은

 

# Union all in pandas

f_union_all= pd.concat([df1, df2])
df_union_all

Pandas의 모든 데이터 프레임을 통합하고 다시 색인화합니다.

pandas의 concat () 함수는 ignore_index = True로 두 데이터 프레임의 결합을 생성합니다.

두 개의 데이터 프레임 df1과 df2를 모두 합집합하면 중복이 생성되고 인덱스가 변경됩니다. 따라서 결과 데이터 프레임은

# Union all with reindex in pandas

df_union_all= pd.concat([df1, df2],ignore_index=True)
df_union_all

 

 

Pandas의 데이터 프레임 통합 :

                                                                      노동 조합 

pandas의 concat () 함수는 drop_duplicates ()와 함께 중복없이 두 데이터 프레임의 결합을 생성합니다. 이는 데이터 프레임의 결합 일뿐입니다.

# union in pandas

df_union= pd.concat([df1, df2]).drop_duplicates()
print(df_union)

두 데이터 프레임 df1 및 df2의 합집합은 중복을 제거하여 생성됩니다. 따라서 결과 데이터 프레임은

 

재색 인화를 통한 Pandas의 데이터 프레임 통합 :

pandas의 concat () 함수는 drop_duplicates ()와 함께 중복없이 두 데이터 프레임의 결합을 생성합니다. 이는 데이터 프레임의 결합 일뿐입니다. 또한 ignore_index = True로 데이터 프레임을 다시 색인화합니다.

# union in pandas

df_union= pd.concat([df1, df2],ignore_index=True).drop_duplicates()
df_union

중복을 제거하여 두 데이터 프레임 df1과 df2의 합집합이 생성되고 인덱스도 변경됩니다. 따라서 결과 데이터 프레임은

반응형