2022.03.10
일일 회고 35회차
Last updated
일일 회고 35회차
Last updated
오늘은 다음주 월요일에 있는 ElasticSearch 세미나의 발표 준비를 진행했으며, ElasticSearch의 색인 성능 최적화 챕터 정리를 완료했다.
색인 성능 최적화에는 문서를 생성할 때 매핑 정보를 동적으로 매핑할 지 아니면 정적으로 매핑할 지에 따라 성능 차이가 발생하는 것을 알 수 있었다. 이때 정적 매핑을 활용해 특정 타입에 따른 역 색인 연산을 줄여서 문서 생성의 시간을 단축시킬 수 있었다.
ElasticSearch는 색인되는 문서들을 버퍼 캐시에서 디스크에 세그먼트 단위로 저장하는 refresh
연산을 refresh_interval
값의 주기로 수행한다는 것을 알 수 있었다. 만약 실시간 검색이 필요하다면 refresh_interval
값을 1초로 지정하고, 대용량 로그 수집처럼 당장 검색해서 사용할 필요가 없다면 주기를 충분히 늘려서 사용하여 색인 성능을 향상시킬 수 있음을 배웠다.
ElasticSearch는 하나의 문서를 처리할 때 각 처리마다 커넥션 연결과 해제를 수행하기 때문에 대량의 문서를 처리하게 되면 시스템에 부하가 발생한다. 그래서 bulk API
를 활용해 색인과 업데이트 등의 작업을 한 번에 모아서 수행하는 방식을 통해 성능을 향상시킬 수 있음을 알게 되었다.
ElasticSearch 세미나 발표 준비 완료하기