본문 바로가기

Data

(23)

[MySQL] 정렬과 그룹핑 처리 - filesort, 임시 테이블, 그리고 그 내부 ORDER BY, GROUP BY, DISTINCT는 쿼리 결과를 정렬하고 중복을 제거하는 연산입니다. 이 세 연산은 인덱스를 활용할 수 있으면 추가 비용 없이 처리되지만, 그렇지 않으면 MySQL은 filesort와 임시 테이블이라는 두 가지 수단을 동원합니다. 이번 포스트에서는 각 연산이 내부적으로 어떤 경로로 처리되는지, filesort 알고리즘은 구체적으로 어떻게 동작하는지, 그리고 임시 테이블은 언제 어떤 엔진으로 생성되는지를 살펴보겠습니다. 1. ORDER BY 처리MySQL의 ORDER BY 처리 경로는 세 가지입니다. 옵티마이저는 쿼리 구조와 인덱스 상태에 따라 이 중 하나를 선택합니다. 1.1 인덱스 정렬정렬 기준 컬럼에 적합한 인덱스가 있다면, 인덱스를 순서대로 읽는 것만으로 정렬된 결..

[MySQL] B-Tree 인덱스 완전 해부 — 구조부터 가용성까지 앞선 편들에서 B-Tree 스토리지 엔진의 원리를 살펴보았습니다. 이번 편에서는 시야를 좁혀 MySQL이 실제로 B-Tree 인덱스를 어떻게 구성하고 활용하는지를 다룹니다. 이론적인 자료구조를 넘어, 인덱스가 추가·삭제될 때 내부에서 무슨 일이 일어나는지, 어떤 조건에서 인덱스가 실제로 효과를 발휘하는지를 구체적으로 살펴보겠습니다. 1. B-Tree 인덱스의 구조 및 특성InnoDB의 클러스터형 인덱스MySQL InnoDB 스토리지 엔진은 테이블 데이터 자체를 클러스터형 인덱스(Clustered Index) 형태로 저장합니다. 즉, 테이블은 별도의 힙 파일(heap file)이 아니라 B-Tree 자체가 곧 테이블입니다.클러스터형 인덱스의 리프 노드에는 실제 행 데이터 전체가 담겨 있습니다. 기본 키(P..

[MySQL] 트랜잭션과 잠금 2편 — 격리 수준과 MVCC 앞선 포스트에서 MySQL의 락 메커니즘을 살펴봤습니다. 락은 쓰기 충돌을 막는 수단이지만, 동시에 실행 중인 트랜잭션들이 서로의 변경 내용을 얼마나 볼 수 있는지는 별도의 개념인 격리 수준(Isolation Level)으로 제어합니다. 이번 포스트에서는 트랜잭션 격리 수준 4가지와, InnoDB가 이를 구현하는 핵심 메커니즘인 MVCC를 살펴봅니다. 1. 이상 현상 (Anomaly)격리 수준은 동시성과 일관성 사이의 트레이드오프입니다. 격리를 느슨하게 할수록 동시성은 높아지지만, 다음과 같은 이상 현상이 발생할 수 있습니다. 더티 리드 (Dirty Read)아직 커밋되지 않은 다른 트랜잭션의 변경 내용을 읽는 현상입니다.트랜잭션 A: salary를 5000 → 8000으로 UPDATE (미커밋)트랜잭션..

[MySQL] 트랜잭션과 잠금 1편 — 락 메커니즘 트랜잭션이 안전하게 동작하려면 동시에 실행되는 다른 트랜잭션으로부터 데이터를 보호하는 장치가 필요합니다. MySQL은 이를 두 계층으로 구현합니다.MySQL 엔진 락: MySQL 서버 계층에서 제공하는 락. 스토리지 엔진과 무관하게 동작합니다.InnoDB 스토리지 엔진 락: InnoDB 내부에서 행(row) 단위로 동작하는 락입니다.이번 포스트에서는 두 계층의 락 구조와, 락 경합이 발생했을 때 어떤 일이 생기는지를 살펴봅니다. 1. MySQL 엔진 락 (서버 레벨)MySQL 엔진 락은 InnoDB가 기본 엔진이 된 이후로는 실무에서 직접 마주칠 일이 많지 않습니다. 그러나 MySQL 락 체계의 전체 그림을 이해하는 데 필요한 배경 지식입니다. 글로벌 락 (Global Lock)MySQL 서버 전체에 걸..

[MySQL] 아키텍처 2편 — InnoDB 스토리지 엔진 1편에서 MySQL 서버 계층이 쿼리를 어떻게 파싱하고 실행 계획을 수립하는지 살펴봤습니다. 이번 글에서는 그 아래, 실제로 데이터를 저장하고 관리하는 InnoDB 스토리지 엔진의 내부 구조를 살펴봅니다. InnoDB를 이해하는 핵심은 한 가지 질문으로 요약됩니다. "디스크 I/O를 어떻게 줄이면서, 동시에 데이터 안전성과 동시성을 어떻게 보장하는가?" 아래에서 살펴볼 모든 컴포넌트는 이 세 가지 목표 중 하나, 혹은 그 이상을 위해 존재합니다. 1. 버퍼 풀 (Buffer Pool)목적: 디스크 I/O 최소화 InnoDB의 가장 핵심적인 메모리 구조입니다. 디스크에서 읽은 데이터 페이지와 인덱스 페이지를 메모리에 캐싱해, 동일한 데이터를 다시 읽을 때 디스크 I/O 없이 메모리에서 바로 반환합니다. 쓰..

[MySQL] 아키텍처 1편 — 엔진 아키텍처 MySQL을 매일 사용하면서도, 쿼리를 실행하면 내부에서 정확히 무슨 일이 벌어지는지 설명하기는 쉽지 않습니다. 파서가 뭘 하고, 옵티마이저가 뭘 결정하며, 스토리지 엔진은 왜 교체 가능한 구조인지 — 이 글에서는 클라이언트가 SQL을 보내는 순간부터 결과가 돌아오기까지의 흐름을 단계별로 살펴봅니다. 1. 전체 구조 — 두 계층의 분리MySQL의 아키텍처는 크게 두 계층으로 나뉩니다.MySQL 서버 계층 (Server Layer): 쿼리 파싱, 최적화, 실행 계획 수립 등 데이터베이스의 핵심 로직을 담당합니다.스토리지 엔진 계층 (Storage Engine Layer): 실제 데이터를 디스크에 읽고 쓰는 역할을 담당합니다.이 두 계층은 명확하게 분리되어 있으며, 스토리지 엔진은 플러그인 방식으로 교체할 ..

[Kafka] 카프카 컨슈머: 종료, 역직렬화, 독립 실행 이 글은 "카프카 핵심 가이드(Kafka: The Definitive Guide)"를 기반으로 작성한 시리즈 포스트입니다.이번 편에서는 컨슈머를 안전하게 종료하는 방법, 역직렬화, 그리고 컨슈머 그룹 없이 특정 파티션을 직접 읽는 독립 실행 컨슈머를 다룹니다.1. 폴링 루프 벗어나기컨슈머는 while (true) 루프 안에서 poll()을 반복합니다. 이 루프를 안전하게 종료하려면 어떻게 해야 할까요? 문제: poll()은 블로킹 호출이다poll(Duration.ofMillis(1000))은 레코드가 없으면 최대 1초간 블로킹됩니다. 이 상태에서 SIGTERM 같은 종료 신호를 받아도 poll()이 반환될 때까지 종료 처리를 시작할 수 없습니다. 루프 조건 변수(while (running))를 바꿔도 현..

[Kafka] 카프카 컨슈머: 설정과 오프셋 관리 이 글은 "카프카 핵심 가이드(Kafka: The Definitive Guide)"를 기반으로 작성한 시리즈 포스트입니다.이번 편에서는 컨슈머 동작을 제어하는 주요 설정, 오프셋 커밋 전략, 리밸런스 리스너, 그리고 특정 오프셋으로 이동하는 seek API를 다룹니다.1. 주요 컨슈머 설정5편에서 다룬 필수 속성 외에, 컨슈머 동작에 큰 영향을 미치는 설정들입니다. Fetch 관련 설정fetch.min.bytes브로커가 fetch 요청에 응답할 때 반환할 최소 데이터 크기입니다. 기본값은 1바이트로, 레코드가 하나라도 있으면 즉시 반환합니다. 값을 높이면 브로커가 데이터가 쌓일 때까지 기다린 뒤 반환하므로, 트래픽이 적은 환경에서 불필요한 요청 횟수를 줄일 수 있습니다. fetch.max.wait.msf..

이전 1 2 3 다음

티스토리툴바