반응형 분류 전체보기158 chroma vectordb import jsonfrom pathlib import Pathfrom typing import List, Dict, Anyimport argparseimport chromadbfrom sentence_transformers import SentenceTransformer# -------- 설정 --------INPUT_JSON = "data/emb_chunks.json" # { "fileA.json": [ {chunk, content, vector}, ... ], ... }PERSIST_DIR = "chroma_store"COLLECTION = "docs"DISTANCE = "cosine" # cosine / l2 / ipEMBED_MODEL = "sentence-t.. 2025. 10. 15. ODR research ODR research & reverse engineeringpaper 대신 참고 link : https://blog.langchain.com/open-deep-research/0. ODR pipeline- scope : 리서치 범위 설정 (user classification, Brief generation)- research : 실제 리서치 수행 (이때 supervisor 과 sub agent 동작)- write : 최종 보고서 작성 (one-shot report generation)https://blog.langchain.com/open-deep-research/1. Scope1) User classification (classify with_user 노드): 리서치 요청시에 사용자의 대화를 통해 추.. 2025. 10. 14. ㅊㅋㅌㅍ 2025. 10. 14. as https://scrawny-shoe-074.notion.site/ODR-research-reverse-engineering-2887ebe4bf198098aa0ec581c9df8253 2025. 10. 14. odr study - paper 대신 참고 link : https://blog.langchain.com/open-deep-research/## ODR pipeline- scope : 리서치 범위 설정 (user classification, Brief generation)- research : 실제 리서치 수행 (이때 supervisor 과 sub agent 동작)- write : 최종 보고서 작성 (one-shot report generation)graph 구조- **Sc.. 2025. 10. 14. ca System Prompt (Code Generation & Editing)You are a senior software engineer.The main programming language is {computing_lang}.Follow user requests to generate, edit, explain, or fix code accurately.Always output clean, well-structured, and runnable code with brief explanations.When editing, include a short summary of changes or a diff.Add concise and meaningful comments inside the code to improv.. 2025. 10. 13. MCP MCP ? MCP(Model Context Protocol)MCP는 쉽게 말해 LLM과 외부 데이터 소스(웹 API, 데이터베이스, 파일 시스템 등)를 하나로 연동할 수 있게 해주는 개방형 표준 프로토콜 MCP 이전의 Tool calling - 프롬프트로 사용자 요청받은 후, LLM (호스트 application) 이 직접 파싱해서 도구를 호출 - 도구 API 마다 포맷이 다르기 때문에 파싱을 잘못할 경우 호출이 제대로 안됨 - 새로운 도구 추가할때마다 프롬프트와 파서 둘다 수정 필요 ex. 1) 사용자가 프롬프트 입력 - " 서울 날씨 알려줘" 2) LLM 프롬프트 안의 규칙을 따라 문자열로 도구 호출 "get_weather("Seoul") .. 2025. 8. 14. [1] OCR(Optical Character Recognition) 의 모델 구조, 평가 방법, 사용가능한 API 이번 게시물에서는 OCR(Optical Character Recognition) 의 모델 구조, 평가 방법, 사용가능한 API 종류에 대해 설명하고 다음 게시물에서 각 API 별 장단점과 실제 데이터로 성능을 비교한 결과를 공유하고자 한다. 1. OCR(Optical Character Recognition) 이란? OCR 모델의 구조 : Text detection + Text recognition Text detection - 글자의 위치를 찾고 Text recognition - 어떤 글자 인지를 인식하자 1) OCR 알고리즘의 유형 a. Two stage algorithm : OCR Text Dectection 과 Text Recogniti.. 2025. 2. 14. GCN 기본 개념 1. Graph neural network란? Image, Sequential data(=Sentence) 이외에 input data구조가 graph인 경우, 이 graph data를 학습해야할 때가 있다. (ex. 영상에서의 graph, 분자구조 graph, Social graph ...) Vertices / Node (=노드) : user, item, 원자 Edge (=엣지) : click, connectivity +) spectral VS spatial ## Spatial - 우리가 일반적으로 이해하고 있는 CNN 은 spatial - Spatial graph convolution은 convolution 연산을 graph위에서 직접 수행하는 방식으로, 각 노드와 가깝게 연결된 이웃 노드들에 한해서 .. 2022. 8. 30. [Recommendation][논문리뷰] Variational Autoencoders for Collaborative Filtering 지난 포스팅들에 이어서 VAE (Variational Autoencoder)를 활용한 추천 알고리즘을 살펴보려한다. 그중에서도 이번에 볼 논문은 mult-vae라고 불리는 " Variational Autoencoders for Collaborative Filtering" 논문이다. [ index ] pre. AutoEncoder과 Recommendation system ------ 논문 내용 ----- 1. Introduction 2. Method 3. Related Work 4. Empirical Study pre1. AutoEncoder과 Recommendation system Autoencoder를 추천시스템에 쓰는 이유는? 1. 차원 축소 - matifold learning (basic AE) 상.. 2022. 7. 24. 이전 1 2 3 4 ··· 16 다음 728x90 반응형