python에서 set을 array 형태로 구성하는 방법에 대해 알아보자.
python에서 set의 이점 중에 하나가 중복된 내용을 자동 필터링한다는 점이다. 중복된 데이터가 포함된 큰 DataFrame을 처리 하는 경우에 사용하면 유용하다. 다만 중복 처리해야 할 필드 들이 많아서 set를 여러개 사용해야 하고, 반복을 위해서는 set를 array화 해서 사용 해야 했었는데, 생각 처럼 간단치는 않았다. 여러번 시행 착오 끝에 아래와 같은 방법을 stackoverflow를 통해 찾을 수 있었다. 그리고 혹시나 잊을 듯 하여 내 블로그에 잊기 전에 keep 해놓는다,
아래와 같이 6개짜리 set을 구성요소로 가지는 list 형 변수인 sets을 선언하고,
각 요소를 index로 접근하여 원하는 데이터를 할당하면 된다.
sets=[set() for i in range(6)] #array of sets
sets[0] = ([1,2,3,4,5])
sets[1] = ([4,7,6,7,8])
sets[2] = ([9,10,11,12,13])
sets[3] = ([13,15,16,17,18])
sets[4] = ([19,20,21,22,23])
sets[5] = ([24,25,26,27,28])
아래와 같이 확인해보면 sets의 type은 list이며, for loop를 통해 접근이나 출력을 할 수 있다.
각각의 용도에 맞게 사용하면 될 것 같다.
댓글 영역