본문 바로가기
728x90
반응형

Study134

[Machine learning] 쉽게 설명하는 Cross Validation 교차검증 index 교차검증이란? 교차검증을 사용하는 이유 코드 및 결과 추가 질문들 (Stratified K-fold 교차검증) 1. 교차 검증 (cross validation) : 모델의 학습 과정에서 학습 / 검증데이터를 나눌때 단순히 1번 나누는게 아니라 K번 나누고 각각의 학습 모델의 성능을 비교하여 평균 값으로 0) 우선 데이터를 왜 나누나? 학습 모델의 한명의 학생이라하고, 우리는 대량의 문제집(데이터) 로 학생을 학습시킨다. 이때 효율적인 학습을 위해 문제집(데이터) 학습 분량을 나누는데 학습 데이터 (Training set) - 문제집의 문제은행 검증 데이터 (Validation set) - 문제집에 속한 기출 모의고사 (성능 검증 / 학습에는 활용되지 않음 - 자세한 설명은 뒤에) 시험 데이터(.. 2020. 7. 26.
[백준][heap] 최소힙 python (200726) 1. 문제 설명 https://www.acmicpc.net/problem/1927 1927번: 최소 힙 첫째 줄에 연산의 개수 N(1≤N≤100,000)이 주어진다. 다음 N개의 줄에는 연산에 대한 정보를 나타내는 정수 x가 주어진다. 만약 x가 자연수라면 배열에 x라는 값을 넣는(추가하는) 연산이고, x가 0이� www.acmicpc.net 2. 풀이 핵심 개념 : heap 을 다뤄야 함. 0 이 아닌 다른 숫자가 들어왔을 때는 heappush 0 이 들어오면 heappop 한 뒤 print 이때 pop 할 숫자 없으면 print 0 1) 내 풀이 (런타임 에러) import heapq N = int(input()) heap_list = [] heapq.heapify(heap_list) for _ in.. 2020. 7. 26.
[프로그래머스][heap] 라면공장 python (200725) 1. 문제설명 1) 라면 공장에서는 하루에 밀가루를 1톤씩 사용합니다. 원래 밀가루를 공급받던 공장의 고장으로 앞으로 k일 이후에야 밀가루를 공급받을 수 있기 때문에 해외 공장에서 밀가루를 수입해야 합니다. 해외 공장에서는 향후 밀가루를 공급할 수 있는 날짜와 수량을 알려주었고, 라면 공장에서는 운송비를 줄이기 위해 최소한의 횟수로 밀가루를 공급받고 싶습니다. 현재 공장에 남아있는 밀가루 수량 stock, 밀가루 공급 일정(dates)과 해당 시점에 공급 가능한 밀가루 수량(supplies), 원래 공장으로부터 공급받을 수 있는 시점 k가 주어질 때, 밀가루가 떨어지지 않고 공장을 운영하기 위해서 최소한 몇 번 해외 공장으로부터 밀가루를 공급받아야 하는지를 return 하도록 solution 함수를 완성.. 2020. 7. 25.
[Machine learning] label encoding VS one-hot encoding 언제 뭘 써야하나. 1. 인코딩이 필요한 이유 우리는 어떤 라벨 정보를 텍스트로 넣을 수 없다. 숫자화, 벡터화 시켜야 한다. 따라서 이를 숫자로 인코딩! 시켜줘야하는데 그 방법에 따라 label encoding 과 one-hot encoding 로 나뉜다. 2. 예시 가령 타이타닉 생존자 데이터에서 타이타닉호의 좌석 등급을 예로 들자면 우리는 모델에 first class, second class, third class 를 각각 숫자로 인코딩하여 입력시켜줘야한다. 종류 first class second class third class label encoding 1 2 3 one-hot encoding [1,0,0] [0,1,0] [0,0,1] 원핫 인코딩은 라벨 개수가 입력 차원이 된다. 예시는 3가지 클래스로 나눠지기 때.. 2020. 7. 25.
[프로그래머스][heap] 힙 정렬(heap sort) 개념 + 더 맵게 python (200722) 1. 문제 설명 매운 것을 좋아하는 Leo는 모든 음식의 스코빌 지수를 K 이상으로 만들고 싶습니다. 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 Leo는 스코빌 지수가 가장 낮은 두 개의 음식을 아래와 같이 특별한 방법으로 섞어 새로운 음식을 만듭니다. 섞은 음식의 스코빌 지수 = 가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2) Leo는 모든 음식의 스코빌 지수가 K 이상이 될 때까지 반복하여 섞습니다. Leo가 가진 음식의 스코빌 지수를 담은 배열 scoville과 원하는 스코빌 지수 K가 주어질 때, 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 섞어야 하는 최소 횟수를 return 하도록 solution 함수를 작성해주세요. * 제한 사항 s.. 2020. 7. 25.
[프로그래머스][stack/queue] 주식가격 python (200722) 1. 문제 1) 문제 설명 초 단위로 기록된 주식가격이 담긴 배열 prices가 매개변수로 주어질 때, 가격이 떨어지지 않은 기간은 몇 초인지를 return 하도록 solution 함수를 완성하세요. 2) 제한사항 prices의 각 가격은 1 이상 10,000 이하인 자연수입니다. prices의 길이는 2 이상 100,000 이하입니다. 3) 입출력 예시 prices return [1, 2, 3, 2, 3] [4, 3, 1, 1, 0] 4) 입출력 예시 설명 1초 시점의 ₩1은 끝까지 가격이 떨어지지 않았습니다. 2초 시점의 ₩2은 끝까지 가격이 떨어지지 않았습니다. 3초 시점의 ₩3은 1초뒤에 가격이 떨어집니다. 따라서 1초간 가격이 떨어지지 않은 것으로 봅니다. 4초 시점의 ₩2은 1초간 가격이 떨어.. 2020. 7. 22.
[프로그래머스][stack/queue] 기능개발 python (200720) 1. 문제 설명 문제 설명 프로그래머스 팀에서는 기능 개선 작업을 수행 중입니다. 각 기능은 진도가 100%일 때 서비스에 반영할 수 있습니다. 또, 각 기능의 개발속도는 모두 다르기 때문에 뒤에 있는 기능이 앞에 있는 기능보다 먼저 개발될 수 있고, 이때 뒤에 있는 기능은 앞에 있는 기능이 배포될 때 함께 배포됩니다. 먼저 배포되어야 하는 순서대로 작업의 진도가 적힌 정수 배열 progresses와 각 작업의 개발 속도가 적힌 정수 배열 speeds가 주어질 때 각 배포마다 몇 개의 기능이 배포되는지를 return 하도록 solution 함수를 완성하세요. 제한 사항 작업의 개수(progresses, speeds배열의 길이)는 100개 이하입니다. 작업 진도는 100 미만의 자연수입니다. 작업 속도는 .. 2020. 7. 20.
[프로그래머스][stack/queue] 프린터 python (200719) 1. 문제 설명 일반적인 프린터는 인쇄 요청이 들어온 순서대로 인쇄합니다. 그렇기 때문에 중요한 문서가 나중에 인쇄될 수 있습니다. 이런 문제를 보완하기 위해 중요도가 높은 문서를 먼저 인쇄하는 프린터를 개발했습니다. 이 새롭게 개발한 프린터는 아래와 같은 방식으로 인쇄 작업을 수행합니다. 1) guideline 1. 인쇄 대기목록의 가장 앞에 있는 문서(J)를 대기목록에서 꺼냅니다. 2. 나머지 인쇄 대기목록에서 J보다 중요도가 높은 문서가 한 개라도 존재하면 J를 대기목록의 가장 마지막에 넣습니다. 3. 그렇지 않으면 J를 인쇄합니다. 예를 들어, 4개의 문서(A, B, C, D)가 순서대로 인쇄 대기목록에 있고 중요도가 2 1 3 2 라면 C D A B 순으로 인쇄하게 됩니다. 내가 인쇄를 요청한 .. 2020. 7. 19.
[SQL] 기본 문법 정리 1 - 200717 SQL 기초 문법 정리 참고 영상 : https://www.youtube.com/watch?v=vgIc4ctNFbc&t=1446s # 1. import data use world; desc city # 2. 한국도시들만 출력 / 인구수 8000000이상 도시 출력 select * from city where CountryCode = "KOR" select * from city where population > 8000000 select * from city where (population > 8000000) and (CountryCode = "KOR") # 3. between 범위를 줄때 - population 7000000 ~ 8000000 select * from city where Populatio.. 2020. 7. 18.
[프로그래머스][stack/queue] 다리를 지나는 트럭 python (200717) https://velog.io/@filoscoder/Data-Structure-Stack-vs.-Queue [Data Structure] Stack vs. Queue? 선형구조? (Linear Structure) 🧐 선형구조 (Linear structure)는 데이터들이 일렬로 저장되어 있는 형태를 가진다. 일렬로 저장하는 방식은 리스트와 각 데이터가 다음 데이터의 위치를 가지는 연결 리스 velog.io 해당 문제는 먼저들어온 기차가 먼저 나가는 방식인 (First In First Out - FIFO) Queue 이다. Queue 는 리스트로 구현할 때 lista.pop(0) 으로 하면됨. --> 리스트 인덱스 0 번째가 빠짐. 1. 문제 문제 설명 트럭 여러 대가 강을 가로지르는 일 차선 다리를 정해.. 2020. 7. 17.
728x90
반응형