본문 바로가기
728x90
반응형

분류 전체보기150

데이터 분석 참고 link 1. feature engineering zzsza.github.io/data/2018/09/08/feature-engineering/ Advanced Feature Engineering with Kaggle Coursera 강의인 How to Win a Data Science Competition: Learn from Top Kaggler, Feature engineering part1, 2를 듣고 정리한 내용입니다 zzsza.github.io 2. hyper-parameter tuning www.kaggle.com/lifesailor/xgboost Xgboost 하이퍼 파라미터 튜닝 Explore and run machine learning code with Kaggle Notebooks | Usin.. 2021. 1. 25.
데이터 사이언티스트, 데이터 분석가 취준기- part1. 대기업 (2020 하반기 최합!) 데이터 사이언티스트, 데이터 분석가 취준기 - part1. 대기업 취업의 실패를 겪은 뒤 나름 철저히 분석하고 준비했던 하반기 결국엔 취업을 했습니다. 이번 포스팅에서는 하반기 취준을 어떻게 준비했고, 도움이 되었던 자료들을 공유해볼까 합니다. 그리고 저는 대기업과 스타트업 취업을 동시에 병행했기에 이번 포스팅에서는 대기업 중심으로 다루고 다음 포스팅에서 스타트업을 다뤄보겠습니다. +) 그리고 아래의 내용을 영상으로도 남겨뒀는데, 혹시 긴 글을 읽을 시간이 없으시다면 이 영상을 참고해주세요 !! https://www.youtube.com/watch?v=yYPespeWC48&t=529s 목차 0. 지원 현황과 결과 1. 상반기 반성 + 하반기 목표 2. 대기업을 가야하나 스타트업을 가야하나 3. 대기업 취.. 2020. 12. 21.
[통계] 사후설계분할표_1218 www.youtube.com/watch?v=FXdEBDj0Z1s&list=PLEUKy_nwlzwEbpOh3peYnSPI0FaeMQJW6&index=21 - 흡연 상황을 임의로 만들 수 없는 것 - 이러한 경우에는 이미 주어진 사후 상황을 기반으로 각각의 조건을 추적해나감 - 이 경우들을 테이블화 해놓은 것이 사후 설계 분할표 - 폐암 여부는 후에 일어나는 일이기 때문에 사후 / 흡연은 전에 일어나는 일이니 사전 ** 만약 이처럼 사후 조건이 없다면, 사전 실험설계 분할표로 만들면 됨. 2020. 12. 18.
[DACON] 태양광 발전량 예측 AI 경진대회 part 1 0. 문제 정의 " Time series regression but ... Quantile regression ! " input(test 하나의 csv) : 0 ~ 6 일치 데이터 입력 (30분 단위 시계열 데이터) 24시간 *2개 * 7일 = 336 row output : 7,8일치 30분 단위 타겟값 예측 (regression) 24시간 * 2개 * 2일 = 96 row 하지만 이때 예측에서 반환되는 것은 Quantile 값이어야함. 즉, 30분 간격의 예측값에 대한 10%,20%,...90% 총 아홉개의 quantile 1. Quantile regression (분위 회귀) ? 참고 자료 : https://medium.com/analytics-vidhya/a-tutorial-on-quantile-r.. 2020. 12. 16.
[Machine learning] ROC 와 ROC-AUC 평가 방법 (Confusion matrix, Recall, Precision, TPR, FPR, Threshold) # Recall 재현율 , precision 정밀도 Recall 재현율 : 실제 양성 중에 양성으로 예측된 것 ( TP / TP + FN ) 실제를 얼마나 잘 재현 Precision 정밀도 : 양성으로 예측된 것 중에 실제 양성인 것 ( TP / TP + FP ) 예측을 얼마나 정밀하게 # ROC curve : 재현율과 1- 특이도 의 곡선을 그린 것 TPR : True Positive Rate ( = 재현율 / 민감도, Recall) 양성인 케이스에 대해 양성으로 잘 예측한 비율.(암환자를 진찰해서 암이라고 진단 함) TP / (TP+FN) TNR : True Negative Rate(=특이도) 음성인 케이스에 대해 음성으로 잘 예측한 비율 (정상환자를 잔찰해서 정상이라고 진단) FPR: False P.. 2020. 11. 10.
[프로그래머스] [완전탐색] 카펫 (201105) programmers.co.kr/learn/courses/30/lessons/42842 코딩테스트 연습 - 카펫 Leo는 카펫을 사러 갔다가 아래 그림과 같이 중앙에는 노란색으로 칠해져 있고 테두리 1줄은 갈색으로 칠해져 있는 격자 모양 카펫을 봤습니다. Leo는 집으로 돌아와서 아까 본 카펫의 노란색과 programmers.co.kr 1. 문제 설명 Leo는 카펫을 사러 갔다가 아래 그림과 같이 중앙에는 노란색으로 칠해져 있고 테두리 1줄은 갈색으로 칠해져 있는 격자 모양 카펫을 봤습니다. Leo는 집으로 돌아와서 아까 본 카펫의 노란색과 갈색으로 색칠된 격자의 개수는 기억했지만, 전체 카펫의 크기는 기억하지 못했습니다. Leo가 본 카펫에서 갈색 격자의 수 brown, 노란색 격자의 수 yellow가.. 2020. 11. 5.
[프로그래머스] [완전탐색] 모의고사 (201103) programmers.co.kr/learn/courses/30/lessons/42840 코딩테스트 연습 - 모의고사 수포자는 수학을 포기한 사람의 준말입니다. 수포자 삼인방은 모의고사에 수학 문제를 전부 찍으려 합니다. 수포자는 1번 문제부터 마지막 문제까지 다음과 같이 찍습니다. 1번 수포자가 찍는 programmers.co.kr 1. 문제 설명 수포자는 수학을 포기한 사람의 준말입니다. 수포자 삼인방은 모의고사에 수학 문제를 전부 찍으려 합니다. 수포자는 1번 문제부터 마지막 문제까지 다음과 같이 찍습니다. 1번 수포자가 찍는 방식: 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, ... 2번 수포자가 찍는 방식: 2, 1, 2, 3, 2, 4, 2, 5, 2, 1, 2, 3, 2, 4, 2, .. 2020. 11. 5.
[프로그래머스][stack/queue] 탑 python (201104) 1. 문제 설명 수평 직선에 탑 N대를 세웠습니다. 모든 탑의 꼭대기에는 신호를 송/수신하는 장치를 설치했습니다. 발사한 신호는 신호를 보낸 탑보다 높은 탑에서만 수신합니다. 또한, 한 번 수신된 신호는 다른 탑으로 송신되지 않습니다. 예를 들어 높이가 6, 9, 5, 7, 4인 다섯 탑이 왼쪽으로 동시에 레이저 신호를 발사합니다. 그러면, 탑은 다음과 같이 신호를 주고받습니다. 높이가 4인 다섯 번째 탑에서 발사한 신호는 높이가 7인 네 번째 탑이 수신하고, 높이가 7인 네 번째 탑의 신호는 높이가 9인 두 번째 탑이, 높이가 5인 세 번째 탑의 신호도 높이가 9인 두 번째 탑이 수신합니다. 높이가 9인 두 번째 탑과 높이가 6인 첫 번째 탑이 보낸 레이저 신호는 어떤 탑에서도 수신할 수 없습니다. 송.. 2020. 11. 5.
[프로그래머스] 완전탐색 소수찾기 - 201102 1. 문제 설명 programmers.co.kr/learn/courses/30/lessons/42839 코딩테스트 연습 - 소수 찾기 한자리 숫자가 적힌 종이 조각이 흩어져있습니다. 흩어진 종이 조각을 붙여 소수를 몇 개 만들 수 있는지 알아내려 합니다. 각 종이 조각에 적힌 숫자가 적힌 문자열 numbers가 주어졌을 때, 종이 programmers.co.kr 2. 풀이 from itertools import combinations,permutations def solution(numbers): count = 0 test_number = [] for i in range(len(numbers)): case = list(set(map(''.join,permutations(numbers,i+1)))) for.. 2020. 11. 3.
[백준] (dp) 숨바꼭질 201101 www.acmicpc.net/problem/1890 1890번: 점프 첫째 줄에 게임 판의 크기 N (4 ≤ N ≤ 100)이 주어진다. 그 다음 N개 줄에는 각 칸에 적혀져 있는 수가 N개씩 주어진다. 칸에 적혀있는 수는 0보다 크거나 같고, 9보다 작거나 같은 정수이며, 가장 www.acmicpc.net 1. 문제 설명 2. 풀이 전형적인 DP 문제인데.. 문제를 착각하고 DFS 로 풀어버렸다. 1) 오답 ### dp 로 풀어 ### DFS from collections import deque import sys next_point = deque([(0,0)]) hist_set = set() matrix = [] black_list = set() N = int(input()) for idx in ra.. 2020. 11. 3.
728x90
반응형