HSEOM GeckoHSEOM
Instagram

흑섬 TECH 블로그 - 데이터 기반 브리딩 기술

레오파드게코 브리딩에 데이터 분석과 AI 기술을 접목합니다. Python, NumPy를 활용한 체중 관리, 성장 추이 분석, 환경 데이터 시각화 등 실무에서 직접 사용하는 기술을 일반인도 이해하기 쉽게 설명합니다.

주요 카테고리

Data Viz 카테고리

NumPy, Pandas를 활용한 데이터 분석과 시각화 기술을 일상 예제로 쉽게 설명합니다.

17개의 글이 있습니다.

Back to Tech
Category

Data Viz

17 posts

[벡터DB·지식그래프 RAG 5편] GraphRAG 완성 — 검색에 LLM을 붙이다
24min read·

[벡터DB·지식그래프 RAG 5편] GraphRAG 완성 — 검색에 LLM을 붙이다

지식그래프 RAG 5부작의 마지막 편. 4편까지 완성한 하이브리드 검색(벡터 진입 + 그래프 확장) 위에 LLM(Claude)을 얹어 GraphRAG를 완성합니다. RAG가 검색+생성인 이유, baseline RAG(벡터검색만)의 한계, neo4j-graphrag의 GraphRAG 클래스로 검색기와 LLM을 묶는 법을 다룹니다. 같은 질문에 baseline RAG vs GraphRAG 답변을 실제로 생성해 비교 — 그래프로 넓힌 맥락이 답에 어떻게 반영되는지 실데이터로 확인합니다.

#GraphRAG#RAG#LLM
[벡터DB·지식그래프 RAG 4편] 벡터 × 그래프 — 하이브리드 검색
25min read·

[벡터DB·지식그래프 RAG 4편] 벡터 × 그래프 — 하이브리드 검색

1편의 벡터 검색과 3편의 그래프 탐색을 한 검색으로 합칩니다. neo4j-graphrag의 VectorRetriever(진입점만)와 VectorCypherRetriever(진입 후 그래프 확장)를 실제로 돌려 비교하고, retrieval_query로 진입 노드에서 관계를 따라 관련 맥락을 모읍니다. 벡터로 진입하고 그래프로 넓히는 GraphRAG의 검색 엔진을 완성합니다. 진입+이웃 ego 그래프 실캡처 포함. 지식그래프 RAG 5부작 4편.

#하이브리드검색#VectorCypherRetriever#neo4j-graphrag
[벡터DB·지식그래프 RAG 3편] Neo4j 지식그래프 — 노드를 관계로 잇다
27min read·

[벡터DB·지식그래프 RAG 3편] Neo4j 지식그래프 — 노드를 관계로 잇다

벡터 창고였던 Neo4j를 진짜 지식그래프로 만듭니다. ABOUT(문서→주제) 구조 관계와 SIMILAR_TO(의미 유사) 관계를 잇고 — 유사도는 vector.similarity.cosine으로 DB 안에서 자동 계산 — Cypher 패턴 매칭으로 구조 질의·의미 이웃·멀티홉을 탐색합니다. '비슷하지만 다른 주제' 같은 조건 결합 질의로 벡터검색의 한계를 넘습니다. Neo4j Browser의 관계 그래프 실캡처 포함. 지식그래프 RAG 5부작 3편.

#지식그래프#Neo4j#Cypher
[벡터DB·지식그래프 RAG 2편] 벡터DB 도입 — Neo4j에 벡터를 심다
26min read·

[벡터DB·지식그래프 RAG 2편] 벡터DB 도입 — Neo4j에 벡터를 심다

1편의 의미 검색을 진짜 벡터DB로 옮깁니다. 전수 비교의 한계(O(N)) → ANN/HNSW 원리 → 벡터DB 생태계(Chroma·Qdrant·pgvector·Neo4j) → docker로 Neo4j 5.26 기동 → 임베딩을 노드에 저장 → 벡터 인덱스 생성 → queryNodes 의미검색까지. Neo4j Browser와 SHOW VECTOR INDEXES 실제 캡처로 확인했습니다. 지식그래프 RAG 5부작 2편.

#벡터DB#Neo4j#벡터인덱스
[벡터DB·지식그래프 RAG 1편] 의미 검색 — 키워드를 넘어서
24min read·

[벡터DB·지식그래프 RAG 1편] 의미 검색 — 키워드를 넘어서

RAG·GraphRAG의 출발점인 의미 검색을 기초부터 다룹니다. 키워드 검색의 한계 → 임베딩으로 문장을 벡터(좌표)로 → sentence-transformers로 직접 임베딩 → 코사인 의미 검색 → 벡터를 그래프로 보기까지. 레오파드게코 사육 FAQ로 실제 돌려보고, 2D 임베딩 지도·유사도 히트맵·의미 이웃 네트워크로 시각화했습니다. 지식그래프 RAG 5부작의 1편.

#임베딩#의미검색#벡터
[Plotly 실전] 우리 집 도마뱀 체중 기록을 인터랙티브 차트로 만들기
20min read·

[Plotly 실전] 우리 집 도마뱀 체중 기록을 인터랙티브 차트로 만들기

한번 씩 재는 도마뱀 체중 기록, 숫자로만 쌓아두고 있나요? Plotly로 체중 분포 히스토그램부터 개체별 성장 차트, 드롭다운/버튼이 달린 대시보드까지 만들어 봅니다.

#plotly#도마뱀#체중기록
[SQL 실습 #5] 음악 스트리밍 서비스 데이터 모델 작성
20min read·

[SQL 실습 #5] 음악 스트리밍 서비스 데이터 모델 작성

N:M 관계를 중간 테이블로 해결합니다. 한 플레이리스트에 여러 곡, 한 곡이 여러 플레이리스트에 담기는 복잡한 관계를 데이터베이스로 구현하는 방법을 배웁니다.

#SQL#N:M 관계#중간 테이블
[SQL 실습 #4] 병원 예약 시스템 데이터 모델 작성
18min read·

[SQL 실습 #4] 병원 예약 시스템 데이터 모델 작성

UNIQUE 제약 조건으로 예약 충돌을 원천 차단합니다. 같은 의사, 같은 시간에 중복 예약 불가 규칙을 데이터베이스 레벨에서 강제하는 방법을 배웁니다.

#SQL#UNIQUE 제약#예약 시스템
데이터에 생명을 불어넣다: Plotly Python 시각화 가이드
12min read·

데이터에 생명을 불어넣다: Plotly Python 시각화 가이드

데이터 시각화는 개발자만의 영역이 아닙니다. 취업 포트폴리오, 사업 기획서, 프로젝트 리포트까지—배워두면 인생 전반에서 요긴하게 쓰이는 스킬입니다. Plotly Python으로 누구나 쉽게 시작할 수 있는 인터랙티브 시각화의 세계를 소개합니다.

#plotly#python#데이터시각화
[SQL 실습 #3] 주차 관리 시스템 데이터베이스 설계
15min read·

[SQL 실습 #3] 주차 관리 시스템 데이터베이스 설계

시간 데이터 다루기와 CASE WHEN 조건문을 배웁니다. 주차 공간, 차량, 주차 기록 테이블로 실시간 요금 계산 시스템을 완성합니다.

#SQL#DATETIME#CASE WHEN
[SQL 실습 #2] 도서관 대출 시스템 테이블 구조 만들기
15min read·

[SQL 실습 #2] 도서관 대출 시스템 테이블 구조 만들기

1:N 관계와 Foreign Key 개념을 배우고 JOIN 쿼리로 여러 테이블을 연결합니다. 회원, 도서, 대출 기록 3개 테이블로 관계형 데이터베이스를 완성합니다.

#SQL#JOIN#Foreign Key
[SQL 입문] 데이터베이스 입문 - 기록의 시작
7min read·

[SQL 입문] 데이터베이스 입문 - 기록의 시작

일상 기록에서 출발하는 데이터베이스 입문. SQL이란 무엇이고, 왜 스키마 설계가 중요한지 알아봅니다. 브리딩 기록부터 시작해 데이터베이스의 본질을 이해합니다.

#데이터베이스#SQL#스키마
[SQL 실습 #1] 학생 정보 데이터베이스 설계
12min read·

[SQL 실습 #1] 학생 정보 데이터베이스 설계

가장 간단한 테이블 설계부터 시작. CREATE TABLE, INSERT, SELECT 기본 문법을 배우고 첫 데이터베이스를 완성합니다. DB Browser for SQLite 실습 포함.

#SQL#CREATE TABLE#Primary Key
[Step 4] 워드클라우드로 텍스트 데이터 시각화하기 - WordCloud + matplotlib
13min read·

[Step 4] 워드클라우드로 텍스트 데이터 시각화하기 - WordCloud + matplotlib

텍스트에서 단어 빈도를 추출하고 워드클라우드 이미지를 생성합니다. 영화 리뷰, SNS 게시글 분석부터 커뮤니티 트렌드 파악까지 활용 방법을 배웁니다.

#워드클라우드#wordcloud#텍스트분석
[Step 3] 막대 그래프로 범주형 데이터 시각화하기 - pandas + matplotlib
14min read·

[Step 3] 막대 그래프로 범주형 데이터 시각화하기 - pandas + matplotlib

월별 판매량, 제품별 성적, 분기별 매출... 범주로 나눌 수 있는 데이터라면 막대 그래프가 정답입니다. Step 3에서는 막대 그래프 그리는 방법을 배웁니다.

#막대그래프#pandas#matplotlib
[Step 2] 산점도로 데이터 관계 파악하기 - matplotlib scatter
12min read·

[Step 2] 산점도로 데이터 관계 파악하기 - matplotlib scatter

운동 시간과 체중 감량, 공부 시간과 성적... 두 데이터 사이에 관계가 있을까요? Step 2에서는 산점도로 데이터 간 상관관계를 한눈에 파악하는 방법을 배웁니다.

#산점도#matplotlib#python
[Step 1] 데이터를 선 그래프로 시각화하는 실습 - yfinance + matplotlib
15min read·

[Step 1] 데이터를 선 그래프로 시각화하는 실습 - yfinance + matplotlib

개발자나 데이터 분석가만 이쁜 그래프를 그릴 수 있는 건 아닙니다. 정말 간단한 지식이면 누구나 화려한 시각화를 만들 수 있어요. Step 1에서는 선 그래프 그리는 방법론을 주식 데이터 예제로 따라해봅니다.

#선그래프#matplotlib#python