본문 바로가기
Study/Recommendation

[Recommendation] 추천 알고리즘 사례 (상품, 홈쇼핑 편성), 추천 관련 python library 정리

by 후이 (hui) 2022. 3. 29.
728x90
반응형

[ 상품 추천 알고리즘 사례 ] 

1. 네이버 쇼핑 추천 AIitems (모델링 부분 중심으로)

참고link : https://tv.naver.com/v/23649833

 

AiTEMS 쇼핑추천의 시작부터 HyperScale AI 도입까지

NAVER Engineering | 양민철/김동현 - AiTEMS 쇼핑추천의 시작부터 HyperScale AI 도입까지

tv.naver.com

 

 

1) 상품 메타정보를 활용한 상품 카테고리 세분화 

- 카테고리 기반에서  -> 상품 메타정보 (브랜드, 쇼핑몰, 검색어) 기준으로 추천 카테고리를 세분화함 

- 추천 사유 (이전 검색 내역, 이전 탐색 페이지 등등)를 파악하는 모듈을 별도로 함께 개발 (어떤 모델인지는 공개하지 않음) 

 

 

2) item embedding 으로 인기 상품 bias 문제 해결 

 

위에 언급된 논문 : https://arxiv.org/abs/1607.07326

 

Meta-Prod2Vec - Product Embeddings Using Side-Information for Recommendation

We propose Meta-Prod2vec, a novel method to compute item similarities for recommendation that leverages existing item metadata. Such scenarios are frequently encountered in applications such as content recommendation, ad targeting and web search. Our metho

arxiv.org

 

- 비인기 상품은 추천이 되지 않는 문제가 발생  "인기 상품 bias", "cold item problem" 

- 사용자의 쇼핑행동과 아이템의 메타정보를 활용해서 임베딩 matrix 만들기 

   사용자가 아디다스, 나이키 운동화를 번갈아가며 탐색할 경우 

   사용자의 쇼핑행동을 통해 - 아디다스와 나이키 운동화과 높은 연관성이 있다는 것을 파악 

   아이템의 메타정보를 통해 - 비인기 운동화(cold-item) 중에서 탐색한 나이키 비인기 운동화와 기능이 비슷한 운동화 추천 가능 악 

- 최종적으로 클릭율이 높은 상품 뿐만 아니라, 아이템 임베딩 matrix를 활용해 사용자 개인에게 필요한 상품, 신규 등록 상품 추천가능

 

 

 

2. 당근마켓 게시글 추천 알고리즘

https://medium.com/daangn/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EA%B0%9C%EC%9D%B8%ED%99%94-%EC%B6%94%EC%B2%9C-1eda682c2e8c

 

딥러닝 개인화 추천

당근마켓 첫화면은 동네 사람들이 사용하는 다양한 물품을 보는 재미가 있어요. 누군가에겐 이제 필요없지만 나에게 유용한 물건들을 발견하게 되고 더불어 저렴하게 득템 할 기회도 종종 있죠

medium.com

 

  • Input : 입력 user가 최근 본 상품게시글 50개, 지역, 다음 글을 본 시간
  • Target : 다음 본 상품 게시글
  • Matrix Factorization 개념을 이용해 User, item matrix 분할 후 사용자 벡터, 상품 게시글 벡터 내적
  • 사용자 벡터, 상품 게시글 embedding, FCNN 거친 후 내적 값 계산 -> 입력 유저의 게시글 선택 확률 반환 

 

[ 참고 - Python library github repository link !  ] 

 

  package 이름 github repo link star
Machine Learning
based model
Surprise  (Python Library) https://github.com/NicolasHug/Surprise 5.3K
LightFM  (Python Library) https://github.com/lyst/lightfm 4K
python-recsys  (Python Library) https://github.com/ocelma/python-recsys 1.4K
Deep Learning
based model
Spotlight  (PyTorch Codes) https://github.com/maciejkula/spotlight 2.7K
TensorRec  (Tensorflow Codes) https://github.com/jfkirk/tensorrec 1.2K
DeepRec  (Tensorflow Codes) https://github.com/cheungdaven/DeepRec 1.1 K
recommenders  
(Tensorflow Codes, Jupyter Notebook Tutorial)
https://github.com/microsoft/recommenders 13K

 

출처 : https://github.com/drumcap/data-science-study-bookmarks-for-korean

 

 

[ 홈쇼핑 관련 사례 ] 

1. W쇼핑  - 빅데이터 딥러닝 기술활용 스마트 T-커머스 서비스 발표 자료 

출처 : https://slidesplayer.org/slide/16716506/

 

빅데이터 딥러닝 기술활용 스마트 T-커머스 서비스 - ppt download

목차 사업의 배경 양방향 데이터방송 기술 기반 전자상거래 서비스 딥러닝(Deep Learning)을 이용한 지능화 방송 편성 소싱된 상품 기준 상품의 특성과 프라임타임을 고려하여 최고의 편성으로 최

slidesplayer.org

 

학습 과정 

1) DNN model regression - 상품 정보로 예상 수익 예측 

2) 헝가리안 알고리즘 -  판매시간 + 예상 수익 예측 (1번의 아웃풋으로) 최대 가중치 매칭 --> 최적의 편성 시간표 도출 

 

헝가리안 알고리즘 자세한 설명은 : http://www.secmem.org/blog/2021/04/18/hungarian-algorithm/

 

 

2. NS 홈쇼핑 매출 예측, 편성 최적화 경진대회 

https://www.youtube.com/watch?v=32Y5Vtngc-Y&t=7881s  2:10:20 부터 우승 사례 설명

 

 

  • NS 홈쇼핑에서 제공한 분당 상품별 실적 데이터에 외부 데이터 추가 및 재가공
  • 메타 데이터 수집 : NS 쇼핑몰 사이트에서 상품 메타 데이터 크롤링
  • 활용 외부 데이터 : 공휴일 데이터, 기상청 데이터, 소비자 심리지수 데이터
  • 해당 데이터로 전처리, 피쳐 생성 과정을 거친 뒤 Xgboost 평균 앙상블로 취급액 예측 모델 설계

 

  • 예측된 상품 매출액(취급액)을 기준으로  헝가리안 알고리즘 적용
  • 취급액을 최대화 하는 최적의 날짜 도출 후 해당 시간에 상품 편성
728x90
반응형

댓글