MySQL 엔진 아키텍처 (1)
1. MySQL 전체 구조
2. MySQL 스레딩 구조
3. 메모리 할당 및 사용 구조
1. MySQL 전체 구조
MySQL은 일반적인 상용 RDBMS와 프로그래밍 언어 대부분으로부터 MySQL 서버(MySQL엔진 + 스토리지엔진)에 접근할 수 있는 기능을 지원한다.
MySQL Server는 MySQL엔진과 Storage엔진으로 구성되어 있다. 또한 스토리지 엔진은 핸들로 API를 만족하면 누구든지 스토리지 엔진을 구현하여 MySQL서버에 추가하여 사용할 수 있다.
MySQL Architecture를 공부하는 목적은 MySQL 쿼리(Query)를 작성하고 튜닝할 때 필요하다. MySQL는 다른 DBMS에 비하여 구조가 상당히 독특한 편이다. 사용자 입장에서는 차이를 느끼기 어렵겠지만, 사실 독특한 구조 때문에 다른 DBMS에서 가질 수 없는 장점을 누릴 수 있고, 반대로 다른 DBMS에서 문제되지 않을 것들이 종종 존재하기도 하다.
MySQL 전체 아키텍처
1.1 MySQL 엔진
MySQL 엔진은 클라이언트로부터의 접속 및 쿼리 요청을 처리하는 커넥션 핸들러와 SQL 파서, 전처리기, SQL옵티마이저가 중심을 이룬다.
또한, MySQL은 표준SQL(ANSI SQL) 문법을 지원하기 때문에 표준 문법에 따라 작성된 쿼리는 타 DBMS와 호환되어 실행될 수 있다.
1.2 Storage 엔진
MySQL 엔진은 요청된 SQL 문장을 분석하거나 최적화하는 등 DBMS의 두뇌에 해당하는 처리를 수행하고, 실제 데이터를 디스크 스토리지에 저장하거나 디스크 스토리지로부터 데이터를 읽어오는 부분은 스토리지 엔진이 전담한다.
아래 명령어와 같이 테이블이 사용할 스토리지 엔진을 지정해주면, 이후 해당 테이블의 모든 읽기나 변경 작업은 정의한 스토리지 엔진이 처리하게 된다.
CREATE TABLE '테이블명' (fd1 INT, df2 INT) ENGINE=INNODB;
각 스토리지 엔진은 성능 향상을 위해 키 캐시(MyISAM)나 InnoDB 버퍼 풀과 같은 기능을 내장하고 있다.
1.3 핸들러 API
MySQL 엔진의 쿼리실행기에서 데이터를 쓰거나 읽을 때는 각 스토리지 엔진에 쓰기 또는 읽기를 요청하게 되는데, 이러한 요청을 핸들러(Handler) 요청이라 하고, 여기서 사용되는 API를 핸들러 API라고 한다. InnoDB 스토리지 엔진 또한 이 핸들러 API를 이용하여 MySQL 엔진과 데이터를 주고받는다.
이런 핸들러 API를 통해 얼마나 많은 데이터(레코드) 작업이 있었는지는 아래 명령으로 확인 가능하다.
SHOW GLOBAL STATUS LIKE 'Handler%';
2. MySQL 스레딩 구조
MySQL 스레딩 구조
MySQL 서버는 프로세스 기반이 아니라 스레드 기반으로 작동한다. 크게 포그라운드(Foreground) 스레드와 백그라운드(Background) 스레드로 구분할 수 있다.
MySQL서버에서 실행 중인 스레드 목록은 다음과 같이 performance_schema 데이터베이스의 threads 테이블을 통해 확인할 수 있다.
SELECT thread_id, name, type, processlist_user, precesslist_host
FROM performance_schema.threads
ORDER BY type, thread_id;
위와 같은 명령어를 통해 실행 중인 전체 스레드 목록을 확인할 수 있다.
백그라운드 스레드의 개수는 MySQL 서버의 설정내용에 따라 가변적일 수 있으며, 동일한 이름의 스레드가 2개 이상씩 보일 경우에는 MySQL 서버의 설정내용에 의해 여러 스레드가 동일 작업을 병렬로 처리하는 경우이다.
참고로 'thread/sql/one_connection' 스레드의 경우에는 실제 사용자의 요청을 처리하는 포그라운드 스레드이다.
2.1 포그라운드(클라이언트) 스레드
포그라운드 스레드는 최소 MySQL서버에 접속된 클라이언트 수만큼 존재하며, 주로 각 클라이언트 사용자가 요청하는 쿼리 문장을 처리한다.
클라이언트가 작업을 마치고 커넥션을 종료하면 해당 커넥션을 담당하던 스레드는 다시 스레드 캐시(Thread cache)로 되돌아간다.
이때 스레드 캐시에 일정 개수 이상의 대기 중인 스레드가 존재할 경우에는 캐시에 넣지 않고 종료시켜 일정 개수의 스레드만 대기시키도록 유지한다.
포그라운드 스레드는 데이터를 MySQL의 데이터 버퍼나 캐시로부터 가져오며, 버퍼나 캐시가 없는 경우에는 직접 디스크의 데이터나 인덱스 파일으로부터 데이터를 읽어와 작업을 처리한다.
MyISAM 데이블은 디스크 쓰기 작업까지 포그라운드 스레드가 처리하지만(MyISAM도 지연된 쓰기가 있지만 일반적인 방식은 아님), InnoDB 테이블은 데이터 버퍼나 캐시까지만 포그라운드 스레드가 처리하고, 나머지 버퍼로부터 디스크까지 기록하는 작업은 백그라운드 스레드가 처리한다.
2.2 백그라운드 스레드
MyISAM의 경우 별로 해당 사항이 없지만, InnoDB는 다음과 같이 여러 가지 작업이 백그라운드로 처리된다.
- 인서트 버퍼(Insert buffer)를 병합하는 스레드
- 로그를 디스크로 기록하는 스레드
- InnoDB 버퍼 풀의 데이터를 디스크에 기록하는 스레드
- 데이터를 버퍼로 읽어오는 스레드
- 잠금이나 데드락을 모니터링하는 스레드
모두 중요한 역할을 하지만, 가장 중요한 것은 '로그 스레드(log thread)와 버퍼의 데이터를 디스크로 내려쓰는 작업을 처리하는 쓰기 쓰레드(Write thread)이다.
MySQL 5.5버전부터 데이터 쓰기/읽기 스레드의 개수를 2개 이상 지정할 수 있게 되었으며, innodb_write_io_threads와 innodb_read_io_threads 시스템 변수로 스레드 개수를 설정한다.
InnoDB에서도 데이터를 읽는 작업은 주로 클라이언트 스레드에서 처리되기 때문에 읽기 스레드는 많이 설정할 필요가 없지만, 쓰기 스레드는 아주 많은 작업을 백그라운드로 처리하기 때문에 일반적으로 내장 디스크를 사용할 때는 2~4 정도, DAS나 SAN과 같은 스토리지를 사용할 때는 디스크를 최적으로 사용할 수 있을 만큼 충분히 설정하는 것이 좋다.
사용자의 요청을 처리하는 도중 데이터의 쓰기 작업은 지연(버퍼링)되어 처리될 수 있지만, 데이터의 읽기 작업은 절대 지연될 수 없다.
그래서 일반 상용 DBMS에는 대부분 쓰기 작업을 버퍼링해서 일괄처리하는 기능을 탑재돼 있으며, InnoDB 또한 이러한 방식으로 처리한다.
하지만, MyISAM은 그렇지 않고 사용자 스레드가 쓰기 작업까지 함께 처리하도록 설계돼 있다. 이러한 이유로 InnoDB에서는 INSERT, UPDATE, DELETE 쿼리로 데이터가 변경되는 경우 데이터가 디스크의 데이터 파일로 완전히 저장될 때까지 기다리지 않아도 된다. 반면, MyISAM에서 일반적인 쿼리는 쓰기 버퍼링 기능을 사용할 수 없다.
3. 메모리 할당 및 사용 구조
MySQL 서버 내 메모리 구조
MySQL에서 사용되는 메모리 공간은 글로벌 메모리 영역과 세션(커넥션) 메모리 영역으로 구분할 수 있다.
글로벌 메모리 영역의 모든 메모리 공간은 MySQL 서버가 시작되면서 운영체제로부터 할당된다. 운영체제의 종류에 따라 다르겠지만 요청된 메모리 공간을 100% 할당해줄 수도 있고, 그 공간만큼 예약해두고 필요할 때 조금씩 할당해주는 경우도 있다.
두 영역은 MySQL 서버 내에 존재하는 많은 스레드가 공유해서 사용하는 공간인지 여부에 따라 구분된다.
3.1 글로벌 메모리 영역
일반적으로 클라이언트 스레드의 수와 무관하게 하나의 메모리 공간만 할당된다. 단, 필요에 따라 2개 이상의 메모리 공간을 할당받을 수도 있지만 클라이언트 스레드 수와는 무관하며, 생성된 글로벌 메모리 영역이 n개라 하더라도 모든 스레드에 의해 공유된다.
- 테이블 캐시
- InnoDB 버퍼 풀
- InnoDB 어댑티브 해시 인덱스
- InnoDB 리두 로그 버퍼
3.2 로컬(세션, 커넥션) 메모리 영역
MySQL 서버상에 존재하는 클라이언트 스레드가 쿼리를 처리하는 데 사용하는 메모리 영역이다. 클라이언트가 MySQL 서버에 접속하면 MySQL 서버에서는 클라이언트 커넥션으로부터의 요청을 처리하기 위해 스레드를 하나씩 할당하게 되는데, 클라이언트 스레드가 사용하는 메모리 공간이라고 해서 클라이언트 메모리 영역이라고도 한다.
로컬 메모리는 각 클라이언트 스레드별로 독립적으로 할당되며, 절대 공유되어 사용되지 않는다는 특징이 있다. 일반적으로 글로벌 메모리 영역의 크기는 주의해서 설정하지만 소트 버퍼와 같은 로컬 메모리 영역은 크게 신경 쓰지 않고 설정하는데, 최악의 경우(가능성은 희박하지만)에는 MySQL 서버가 메모리 부족으로 멈춰 버릴 수도 있으므로 적절한 메모리 공간을 설정하는 것이 중요하다.
또한, 각 쿼리의 용도별로 필요할 때만 공간이 할당되고 필요하지 않는 경우에는 MySQL이 메모리 공간을 할당조차도 하지 않을 수 있다.
- 정렬 버퍼(Sort buffer)
- 조인 버퍼
- 바이너리 로그 캐시
- 네트워크 버퍼
출처: ⌜Real MySQL 8.0 (개발자와 DBA를 위한 MySQL 실전 가이드)⌟, 백은빈, 이성욱 지음, 위키북스, 2021.09.08 출간
http://www.kyobobook.co.kr/product/detailViewKor.laf?mallGb=KOR&ejkGb=KOR&barcode=9791158392703
정말 좋은 책인 것 같다. MySQL 아키텍처나 내부구동원리 등을 쉽게 이해할 수 있게 쓰여있다.
'Data Engineering > MySQL' 카테고리의 다른 글
[ MySQL 아키텍처 ] 2. InnoDB 스토리지 엔진 아키텍처 (3) (0) | 2022.10.06 |
---|---|
[ MySQL 아키텍처 ] 2. InnoDB 스토리지 엔진 아키텍처 (2) (0) | 2022.10.05 |
[ MySQL 아키텍처 ] 2. InnoDB 스토리지 엔진 아키텍처 (1) (0) | 2022.10.05 |
[ MySQL 아키텍처 ] 1. MySQL 엔진 아키텍처 (3) (0) | 2022.10.05 |
[ MySQL 아키텍처 ] 1. MySQL 엔진 아키텍처 (2) (2) | 2022.10.04 |