본문 바로가기
728x90
반응형

분류 전체보기150

[NLP] 자연어처리 임베딩 모델 총정리 (word2vec부터 BERT까지) 자연어처리 임베딩 모델들의 전체 컨셉 개념을 복습해보겠다. 이전 모델에 비해서 뭐가 다른지 간단하게만 정리해 둔거니 보다 자세한 자료는 참고링크에서 공부하시길 [ 임베딩 ] 인코딩은 어떤 단어 혹은 대상을 [0,1,0,0,0,0 ... ] 등 0과 1 둘 중 하나의 숫자로 표현하는 개념 임베딩은 이러한 [0,1,0,0,0,0 ... ] 벡터를 --> [0.1,0.2,0.5 ] 등 dense 한 벡터로 만들어줌 그럼 저 벡터를 어떻게 만드냐? 그거에 따라 임베딩 모델들 이름이 달라지게됨 0. Neural Probabilistic Language Model : 이전 단어들을 통해 다음 등장 단어 확률을 계산 ! word2vec의 시초같은 느낌 다음 등장할 단어의 확률을 계산하고, 이를 최대화 하는 방식으로 .. 2020. 11. 1.
[Deep Learning] 음성 인식 모델의 발전 과정 jybaek.tistory.com/793 www.youtube.com/watch?v=gmoEgeRPOoQ&list=TLPQMDExMTIwMjANBSFBbypvBw&index=2 0. 음성 인식 ? [ STT 모델 개발의 pipeline ] 1. 로우 데이터 음성 입력 2. 특징 추출 3. 음성 모델 - DNN, RNN 4. 디코더 ** : 음성 신호를 텍스트로 맵핑 - 음향 모델, 발음 사전 --> 텍스트로 변환 - 언어 모델 --> 텍스트를 벡터로 변환 (기계가 이해) [ 음성인식 모델의 발전과정 ] STT -> LAS -> online streaming recognition (RNN-Transducer, NT, MoChA) [ 음성 분야의 다양한 태스크 ] - Audio Auto Tagging : 지.. 2020. 11. 1.
[백준] (bfs) 숨바꼭질 201031 www.acmicpc.net/problem/1697 1697번: 숨바꼭질 수빈이는 동생과 숨바꼭질을 하고 있다. 수빈이는 현재 점 N(0 ≤ N ≤ 100,000)에 있고, 동생은 점 K(0 ≤ K ≤ 100,000)에 있다. 수빈이는 걷거나 순간이동을 할 수 있다. 만약, 수빈이의 위치가 X일 www.acmicpc.net 1. 문제 풀이 2. 풀이 from collections import deque import sys def solution(start, end): step = 0 stack_list = deque([[start,step]]) if start == end: return 0 while stack_list: now_start, step = stack_list.popleft() x1 = no.. 2020. 10. 31.
[프로그래머스] greedy 체육복 201030 1. 문제 설명 programmers.co.kr/learn/courses/30/lessons/42862 코딩테스트 연습 - 체육복 점심시간에 도둑이 들어, 일부 학생이 체육복을 도난당했습니다. 다행히 여벌 체육복이 있는 학생이 이들에게 체육복을 빌려주려 합니다. 학생들의 번호는 체격 순으로 매겨져 있어, 바로 앞번 programmers.co.kr 점심시간에 도둑이 들어, 일부 학생이 체육복을 도난당했습니다. 다행히 여벌 체육복이 있는 학생이 이들에게 체육복을 빌려주려 합니다. 학생들의 번호는 체격 순으로 매겨져 있어, 바로 앞번호의 학생이나 바로 뒷번호의 학생에게만 체육복을 빌려줄 수 있습니다. 예를 들어, 4번 학생은 3번 학생이나 5번 학생에게만 체육복을 빌려줄 수 있습니다. 체육복이 없으면 수업을 .. 2020. 10. 30.
[Deep Learning] GAN - Generative Adversarial Network (201029) # Gan 의 개념 위조 지폐 만드는 도둑놈 , 경찰의 비유를 많이 하는데, 여기서 위조지폐 만드는 놈은 Generator 경찰은 Descriminator Generator의 목적은 Descriminator가 구분 못하도록 실제 이미지와 유사한 이미지를 만드는 거고 Descriminator의 목적은 실제 이미지와 가짜 이미지를 구분해 내는 것 이 학습 알고리즘의 목표는 Discriminator 가 진짜 가짜를 아예 구분짓지 못하도록 만드는 후륭한 Generator만들기 ! Generator 는 latent space 를 기반으로 Fake image 를 만들어냄, Discriminator 는 0~1사이의 값으로 Fake 여부 판별 가령 1번 Fake image를 진짜 0.2, 가짜 0.8 확률로 판단했다면.. 2020. 10. 30.
[프로그래머스] (이분탐색) 징검다리 programmers.co.kr/learn/courses/30/lessons/43236 코딩테스트 연습 - 징검다리 출발지점부터 distance만큼 떨어진 곳에 도착지점이 있습니다. 그리고 그사이에는 바위들이 놓여있습니다. 바위 중 몇 개를 제거하려고 합니다. 예를 들어, 도착지점이 25만큼 떨어져 있고, 바위가 programmers.co.kr 1. 문제 설명 출발지점부터 distance만큼 떨어진 곳에 도착지점이 있습니다. 그리고 그사이에는 바위들이 놓여있습니다. 바위 중 몇 개를 제거하려고 합니다. 예를 들어, 도착지점이 25만큼 떨어져 있고, 바위가 [2, 14, 11, 21, 17] 지점에 놓여있을 때 바위 2개를 제거하면 출발지점, 도착지점, 바위 간의 거리가 아래와 같습니다. 제거한 바위의 위.. 2020. 10. 29.
[프로그래머스] 입국심사 1. 문제 설명 n명이 입국심사를 위해 줄을 서서 기다리고 있습니다. 각 입국심사대에 있는 심사관마다 심사하는데 걸리는 시간은 다릅니다. 처음에 모든 심사대는 비어있습니다. 한 심사대에서는 동시에 한 명만 심사를 할 수 있습니다. 가장 앞에 서 있는 사람은 비어 있는 심사대로 가서 심사를 받을 수 있습니다. 하지만 더 빨리 끝나는 심사대가 있으면 기다렸다가 그곳으로 가서 심사를 받을 수도 있습니다. 모든 사람이 심사를 받는데 걸리는 시간을 최소로 하고 싶습니다. 입국심사를 기다리는 사람 수 n, 각 심사관이 한 명을 심사하는데 걸리는 시간이 담긴 배열 times가 매개변수로 주어질 때, 모든 사람이 심사를 받는데 걸리는 시간의 최솟값을 return 하도록 solution 함수를 작성해주세요. 제한사항 입.. 2020. 10. 28.
[프로그래머스] 큰 수 만들기 1. 문제 설명 어떤 숫자에서 k개의 수를 제거했을 때 얻을 수 있는 가장 큰 숫자를 구하려 합니다. 예를 들어, 숫자 1924에서 수 두 개를 제거하면 [19, 12, 14, 92, 94, 24] 를 만들 수 있습니다. 이 중 가장 큰 숫자는 94 입니다. 문자열 형식으로 숫자 number와 제거할 수의 개수 k가 solution 함수의 매개변수로 주어집니다. number에서 k 개의 수를 제거했을 때 만들 수 있는 수 중 가장 큰 숫자를 문자열 형태로 return 하도록 solution 함수를 완성하세요. 제한 조건 number는 1자리 이상, 1,000,000자리 이하인 숫자입니다. k는 1 이상 number의 자릿수 미만인 자연수입니다. 입출력 예 numberkreturn 1924 2 94 123.. 2020. 10. 27.
한국어 텍스트 말뭉치 (도메인별 나눠져있음) corpus.korean.go.kr/#none 2020. 10. 24.
[DataScience] pandas - 시각화 (2) (201023) In [4]: import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt 1. plt.bar(x,y)¶ In [5]: fig = plt.figure(figsize = (5,5)) y = [2,3,1] x = np.arange(len(y)) xlabel = ['A','B','C'] plt.title("Bar Chart") plt.bar(x, y, width = 0.5) plt.xlabel('names') plt.ylabel('frequency') plt.grid(True) plt.show() In [6]: people = ['A&.. 2020. 10. 23.
728x90
반응형