[ 상품 추천 알고리즘 사례 ]
1. 네이버 쇼핑 추천 AIitems (모델링 부분 중심으로)
참고link : https://tv.naver.com/v/23649833
1) 상품 메타정보를 활용한 상품 카테고리 세분화
- 카테고리 기반에서 -> 상품 메타정보 (브랜드, 쇼핑몰, 검색어) 기준으로 추천 카테고리를 세분화함
- 추천 사유 (이전 검색 내역, 이전 탐색 페이지 등등)를 파악하는 모듈을 별도로 함께 개발 (어떤 모델인지는 공개하지 않음)
2) item embedding 으로 인기 상품 bias 문제 해결
위에 언급된 논문 : https://arxiv.org/abs/1607.07326
- 비인기 상품은 추천이 되지 않는 문제가 발생 "인기 상품 bias", "cold item problem"
- 사용자의 쇼핑행동과 아이템의 메타정보를 활용해서 임베딩 matrix 만들기
사용자가 아디다스, 나이키 운동화를 번갈아가며 탐색할 경우
사용자의 쇼핑행동을 통해 - 아디다스와 나이키 운동화과 높은 연관성이 있다는 것을 파악
아이템의 메타정보를 통해 - 비인기 운동화(cold-item) 중에서 탐색한 나이키 비인기 운동화와 기능이 비슷한 운동화 추천 가능 악
- 최종적으로 클릭율이 높은 상품 뿐만 아니라, 아이템 임베딩 matrix를 활용해 사용자 개인에게 필요한 상품, 신규 등록 상품 추천가능
2. 당근마켓 게시글 추천 알고리즘
- Input : 입력 user가 최근 본 상품게시글 50개, 지역, 다음 글을 본 시간
- Target : 다음 본 상품 게시글
- Matrix Factorization 개념을 이용해 User, item matrix 분할 후 사용자 벡터, 상품 게시글 벡터 내적
- 사용자 벡터, 상품 게시글 embedding, FCNN 거친 후 내적 값 계산 -> 입력 유저의 게시글 선택 확률 반환
[ 참고 - Python library github repository link ! ]
package 이름 | github repo link | star | |
Machine Learning based model |
Surprise (Python Library) | https://github.com/NicolasHug/Surprise | 5.3K |
LightFM (Python Library) | https://github.com/lyst/lightfm | 4K | |
python-recsys (Python Library) | https://github.com/ocelma/python-recsys | 1.4K | |
Deep Learning based model |
Spotlight (PyTorch Codes) | https://github.com/maciejkula/spotlight | 2.7K |
TensorRec (Tensorflow Codes) | https://github.com/jfkirk/tensorrec | 1.2K | |
DeepRec (Tensorflow Codes) | https://github.com/cheungdaven/DeepRec | 1.1 K | |
recommenders (Tensorflow Codes, Jupyter Notebook Tutorial) |
https://github.com/microsoft/recommenders | 13K |
출처 : https://github.com/drumcap/data-science-study-bookmarks-for-korean
[ 홈쇼핑 관련 사례 ]
1. W쇼핑 - 빅데이터 딥러닝 기술활용 스마트 T-커머스 서비스 발표 자료
출처 : https://slidesplayer.org/slide/16716506/
학습 과정
1) DNN model regression - 상품 정보로 예상 수익 예측
2) 헝가리안 알고리즘 - 판매시간 + 예상 수익 예측 (1번의 아웃풋으로) 최대 가중치 매칭 --> 최적의 편성 시간표 도출
헝가리안 알고리즘 자세한 설명은 : http://www.secmem.org/blog/2021/04/18/hungarian-algorithm/
2. NS 홈쇼핑 매출 예측, 편성 최적화 경진대회
https://www.youtube.com/watch?v=32Y5Vtngc-Y&t=7881s 2:10:20 부터 우승 사례 설명
- NS 홈쇼핑에서 제공한 분당 상품별 실적 데이터에 외부 데이터 추가 및 재가공
- 메타 데이터 수집 : NS 쇼핑몰 사이트에서 상품 메타 데이터 크롤링
- 활용 외부 데이터 : 공휴일 데이터, 기상청 데이터, 소비자 심리지수 데이터
- 해당 데이터로 전처리, 피쳐 생성 과정을 거친 뒤 Xgboost 평균 앙상블로 취급액 예측 모델 설계
- 예측된 상품 매출액(취급액)을 기준으로 헝가리안 알고리즘 적용
- 취급액을 최대화 하는 최적의 날짜 도출 후 해당 시간에 상품 편성
댓글