본문 바로가기
Study/Algorithm & Data structure

[프로그래머스][hash] 베스트앨범 python (200715)

by 후이 (hui) 2020. 7. 15.
728x90
반응형

 

 

1. 문제

문제 설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

 

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

 

제한사항

  • genres[i]는 고유번호가 i인 노래의 장르입니다.
  • plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
  • genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
  • 장르 종류는 100개 미만입니다.
  • 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
  • 모든 장르는 재생된 횟수가 다릅니다.

입출력 예

 

genresplaysreturn

[classic, pop, classic, classic, pop] [500, 600, 150, 800, 2500] [4, 1, 3, 0]

입출력 예 설명

 

classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.

  • 고유 번호 3: 800회 재생
  • 고유 번호 0: 500회 재생
  • 고유 번호 2: 150회 재생

pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.

  • 고유 번호 4: 2,500회 재생
  • 고유 번호 1: 600회 재생

따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.

※ 공지 - 2019년 2월 28일 테스트케이스가 추가되었습니다.

 

==> 정렬의 우선 순위 : 1) 장르전체 재생횟수  2) 각 각 곡별 재생횟수  3) 원래 곡 순서 인덱스 

여기서 중요한 건 각 장르별 재생횟수 높은 두곡만 담겨야함!! 

 

==> 적용해야할 개념 : 다중조건으로 sorting !  (해당 링크 참고) 

https://dailyheumsi.tistory.com/67

 

파이썬 정렬, 다중 조건으로 한 번에 하기.

파이썬으로 문제를 풀다보면, 여러 조건으로 소팅을 해야하는 경우가 있다. 일반적인 소팅은 다음과 같이 sorted() 혹은 .sort() 를 사용한다. a = [4,1,2,5,7,3,6] b = sorted(a) # b = [1,2,3,4,5,6,7] sorted()..

dailyheumsi.tistory.com

 

 

2. 풀이 

1) [[ 0번째곡 장르 재생수,  0번째곡 재생수, 0번째곡 인덱스 ], [1번째....] ] 2d list 만들어서 다중조건 sorting 적용  (결과 : PASS)

 

def solution(genres, plays):
    genre_cnt_dict = {}
    for genre, play in zip(genres, plays):
        if genre in genre_cnt_dict.keys():
            genre_cnt_dict[genre] += play
        else:
            genre_cnt_dict[genre] = play
    print(genre_cnt_dict)

    info_dict = {}
    for idx, info in enumerate(zip(genres, plays)):
        genre, play_cnt = info[0], info[1]
        genre_cnt = genre_cnt_dict[genre]
        if genre in info_dict.keys():
            if len(info_dict[genre]) >= 2:
                info_dict[genre].append([genre_cnt, play_cnt, idx])
                info_dict[genre] = sorted(info_dict[genre], key=lambda x: -x[1])[:2]
            else:
                info_dict[genre].append([genre_cnt, play_cnt, idx])
        else:
            info_dict[genre] = [[genre_cnt, play_cnt, idx]]

    final_list = sum(info_dict.values(), [])
    ffinal_list = sorted(final_list, key=lambda x: (-x[0], -x[1], x[2]))

    return [i[2] for i in ffinal_list]

    answer = 0

    순서 : 

       a.  각 장르의 곡 재생횟수를 세는 genre_cnt_dict 만듦 

       b. 2d list 생성을 위해 info_dict 딕셔너리 또만듬 

          - 장르를 키로 두고 값으로는 [해당장르 재생횟수, 해당곡 재생횟수, 곡의 인덱스] 담음

                                                  ** 여기서 해당 장르 재생횟수는 a 에서 만든 genre_cnt_dict 활용 

 

          - 담는 과정에서 특정 장르의 값의 길이가 2 이상이 되는경우 (2곡이상이 되는경우)

             해당곡 재생횟수를 기준으로 정렬하여 2개만 살림 

             (info_dict[genre] = sorted(info_dict[genre], key=lambda x: -x[1])[:2] --> 이 부분)

 

       c. info_dict 의 값만 가져온 뒤, sum 을 활용해 2d list를 만들고 , 문제에서 제시한 다중정렬 적용 

          1) 장르전체 재생횟수(내림차순)  2) 각 각 곡별 재생횟수(내림차순) 3) 원래 곡 순서 인덱스(오름차순) 

          ffinal_list = sorted(final_list, key=lambda x: (-x[0], -x[1], x[2]))   

 

         

       d. 마지막으로 인덱스만 필요하니까 리스트의 2번째 요소만꺼내주기~!

 

 

 

 

3. 정리 

프로그래머스 문제는 람다 잘쓰는 사람들이 잘 풀도록 만들어진 문제라는 생각이.

참고한 링크 보고 람다 쌉고수 되기.1!

728x90
반응형

댓글