2026년 1월 11일
[가상 면접 사례로 배우는 대규모 시스템 설계 기초] 11. 뉴스 피드 시스템 설계
1. 개요
- 11장에서는 뉴스 피드 시스템 설계 문제를 다룬다.
1.1. 뉴스 피드 란?
- 페이스북의 도움말 페이지에서는 뉴스 피드를 다음과 같이 설명하고 있다.
- 홈 페이지 중앙에 지속적으로 업데이트되는 스토리들
- 사용자 상태 정보 업데이트, 사진, 비디오, 링크, 앱 활동(app activity), 팔로워, 팔로우, 페이지, 좋아요 등을 포함

2. 문제 이해 및 설계 범위 확정
2.1. 시스템 요구사항
- 사용자는 뉴스 피드 페이지에 새로운 스토리를 올릴 수 있어야 하고, 친구들이 올리는 스토리를 볼 수도 있어야 한다.
- 뉴스 피드는 시간 흐름 역순으로 표시된다.
- 한 명의 사용자는 최대 5,000명의 친구를 가질 수 있다.
- 매일 천만 명이 서비스를 방문한다.
- 피드에는 이미지나 비디오 등의 미디어 파일도 포함될 수 있다.
3. 개략적 설계안 제시 및 동의 구하기
- 지금부터 살펴볼 설계안은 두 가지 부분으로 나뉘어 있다.
- 피드 발행:
- 사용자가 스토리를 포스팅하면 해당 데이터를 캐시와 데이터베이스에 기록한다.
- 새 포스팅은 친구의 뉴스 피드에 전송한다.
- 뉴스 피드 생성:
- 뉴스 피드는 모든 친구의 포스팅을 시간 흐름 역순으로 모아서 만든다고 가정한다.
3.1. 뉴스 피드 API
- 뉴스 피드 API는 클라이언트가 서버와 통신하기 위해 사용하는 수단이다. (HTTP 기반)
피드 발행 API
POST /v1/me/feed
- 새 스토리를 포스팅하기 위한 API
- 인자:
- 바디(body): 포스팅 내용
- Authorization 헤더: API 호출을 인증하기 위해 사용
피드 읽기 API
GET /v1/me/feed
- 뉴스 피드를 가져오는 API
- 인자:
- Authorization 헤더: API 호출을 인증하기 위해 사용
3.2. 피드 발행

- 사용자: 모바일 앱이나 브라우저에서 새 포스팅을 올리는 주체
- 로드밸런서: 트래픽을 웹 서버들로 분산
- 웹 서버: HTTP 요청을 내부 서비스로 중계하는 역할을 담당
- 포스팅 저장 서비스(post service): 새 포스팅을 데이터베이스와 캐시에 저장
- 포스팅 전송 서비스(fanout service): 새 포스팅을 친구의 뉴스 피드에 푸시(push)하여, 뉴스 피드 데이터를 빠르게 읽어갈 수 있도록 함.
- 알림 서비스(notification service): 친구들에게 새 포스팅이 올라왔음을 알리거나, 푸시 알림을 보내는 역할
3.3. 뉴스 피드 생성

- 뉴스 피드 서비스(news feed service): 캐시에서 뉴스 피드를 가져오는 서비스
- 뉴스 피드 캐시(news feed cache): 뉴스 피드를 렌더링할 때 필요한 피드 ID를 보관
4. 상세 설계

4.1. 피드 발행
- 대부분의 컴포넌트는 개략적 설계안에서 다룬 정도로 충분할 것이라, 웹 서버와 포스팅 전송 서비스(fanout service)에 초점을 맞추어서 살펴보자.
웹 서버
- 클라이언트와 통신할 뿐 아니라 인증이나 처리율 제한 등의 기능도 수행한다.
- 인증: 올바른 인증 토큰을 Authorization 헤더에 넣고 API를 호출하는 사용자만 포스팅 수행 가능하도록 하는 역할
- 처리율 제한: 스팸을 막고 유해한 콘텐츠가 자주 올라오는 것을 방지하기 위해서 특정 기간 동안 한 사용자가 올릴 수 있는 포스팅 수를 제한
포스팅 전송(팬아웃) 서비스
- 포스팅 전송(팬아웃)은 어떤 사용자의 새 포스팅을 그 사용자와 친구 관계에 있는 모든 사용자에게 전달하는 과정이다.
- 팬아웃에는 두 가지 모델이 존재한다.
- 쓰기 시점에 팬아웃(fanout-on-write)하는 모델
- 읽기 시점에 팬아웃(fanout-on-read)하는 모델
쓰기 시점에 팬아웃(fanout-on-write)하는 모델
- 새로운 포스팅을 기록하는 시점에 뉴스 피드를 갱신하는 방법
- 다시 말해, 포스팅이 완료되면 바로 해당 사용자의 캐시에 해당 포스팅을 기록(pre-computed)하는 것이다.
- 장점
- 빠른 조회: 뉴스 피드를 읽는 데 드는 시간이 짧아진다.
- 단점
- 핫키(hotkey) 문제: 친구가 많은 사용자의 경우 친구 목록을 가져오고 그 목록에 있는 사용자 모두의 뉴스 피드를 갱싱하는 데 많은 시간이 소요될 수 있다.
- 자원 낭비: 서비스를 자주 이용하지 않는 사용자의 피드까지 갱신해야 하므로 컴퓨팅 자원이 낭비된다.
읽기 시점에 팬아웃(fanout-on-read)하는 모델
- 피드를 읽어야 하는 시점에 뉴스 피드를 갱신하는 방법 (on-demand)
- 사용자가 본인 홈페이지나 타임라인을 로딩하는 시점에 새로운 포스트를 가져오게 된다.
- 장점
- 효율적인 자원 사용: 비활성화된 사용자, 또는 서비스에 거의 로그인하지 않는 사용자의 경우에는 이 모델이 유리하다. 로그인하기까지는 어떤 컴퓨팅 자원도 소모하지 않아서다.
- 핫키(hotkey) 문제 방지: 데이터를 친구 각각에 푸시하는 작업이 필요 없으므로 핫키 문제도 생기지 않는다.
- 단점
- 성능 문제: 뉴스 피드를 읽는 데 많은 시간이 소요될 수 있다.
하이브리드 모델
- 본 책에서는 이 두가지 방법을 결합하여 장점은 취하고 단점은 버리는 전략을 취한다.
- 대부분의 사용자에 대해서는 푸시 모델을 사용한다.
- 팔로어가 아주 많은 사용자의 경우에는 팔로어로 하여금 해당 사용자의 포스팅을 필요할 때 가져가도록 하는 풀 모델을 사용한다.
- 또한, 안정 해시(consistent hashing)을 통해 요청과 데이터를 보다 고르게 분산하여 핫키 문제를 줄인다.

- 위 그림은 설계안 가운데 팬아웃 서비스에 관한 부분만 따로 떼어냈다. 지금부터 이 부분을 더 자세히 살펴보자.
- 팬아웃 서비스는 다음과 같이 동작한다.
- 그래프 데이터베이스에서 친구 ID 목록을 가져온다.
- 사용자 정보 캐시에서 친구들의 정보를 가져온다.
- 친구 중 누군가의 피드 업데이트를 무시하기로 설정(mute)하거나,
- 새로 포스팅된 스토리가 일부 사용자에게만 공유되도록 설정된 경우를 처리
- 친구 목록과 새 스토리의 포스팅 ID를 메시지 큐에 넣는다.
- 팬아웃 작업 서버가 메시지 큐에서 데이터를 꺼내어 뉴스 피드 데이터를 뉴스 피드 캐시에 넣는다.
- 뉴스 피드 캐시는 <포스팅 ID, 사용자 ID>의 순서쌍을 보관하는 매핑 테이블
- 이때 주의할 점은 ID만 저장한다. 정보 전체를 모두 저장하게 되면 메모리 요구량이 지나치게 늘어날 수 있기 때문이다.
- 또한 메모리 크기를 적정 수준으로 유지하기 위해서, 이 캐시의 크기에 제한을 두며, 해당 값은 조정이 가능하도록 한다. 어떤 사용자가 뉴스 피드에 올라온 수천 개의 스토리를 전부 훑어보는 일이 벌어질 확률은 지극히 낮기 때문이다.
뉴스 피드 캐시는 어떻게 구성돼있을까?
- 뉴스 피드 캐시의 논리적 구조 →
<사용자 ID → [포스팅 ID 목록]>
- 하지만 책에서는 매핑 테이블 관점에서
<포스팅 ID, 사용자 ID>순서쌍으로 설명
- 예제
사용자 ID | 포스팅 ID |
B | P1001 |
C | P1001 |
D | P1001 |
여기서 드는 의문
- 뉴스 피드를 역순으로 정렬하기 위해서는 등록 시간도 필요해보이는데 왜 책에서는 언급을 하지 않았을까?
4.2. 피드 조회

- 이미지나 비디오와 같은 미디어 콘텐츠는 CDN에 저장하여 빨리 읽어갈 수 있도록 한다.
- 클라이언트가 뉴스 피드를 어떻게 읽어가는지 단계별로 살펴보자.
- 사용자가 뉴스 피드를 읽으려는 요청을 보낸다. (
GET /v1/me/feed) - 로드밸런서가 요청을 웹 서버 가운데 하나로 보낸다.
- 웹 서버는 피드를 가져오기 위해 뉴스 피드 서비스를 호출한다.
- 뉴스 피드 서비스는 뉴스 피드 캐시에서 포스팅 ID 목록을 가져온다.
- 뉴스 피드에 표시할 사용자 이름, 사용자 사진, 포스팅 콘텐츠, 이미지 등을 사용자 캐시와 포스팅 캐시에서 가져와 완전한 뉴스 피드를 만든다.
- 생성된 뉴스 피드를 JSON 형태로 클라이언트에게 보낸다. 클라이언트는 해당 피드를 렌더링한다.
4.3. 캐시 구조

- 캐시는 뉴스 피드 시스템의 핵심 컴포넌트다.
- 본 설계안의 경우에는 위 그림과 같이 캐시를 다섯 계층으로 나눈다.
- 뉴스 피드: 뉴스 피드의 ID를 보관한다.
- 콘텐츠: 포스팅 데이터를 보관한다. 인기 콘텐츠는 따로 보관한다.
- 소셜 그래프: 사용자 간 관계 정보를 보관한다.
- 행동(action): 포스팅에 대한 사용자의 행위에 관한 정보를 보관한다. 포스팅에 대한 ‘좋아요’, 답글 등이 이에 해당한다.
- 횟수(counter): ‘좋아요’ 횟수, 응답 수, 팔로어 수, 팔로잉 수 등의 정보를 보관한다.
5. 마무리
- 지금까지 뉴스 피드 시스템을 설계하면서, 뉴스 피드 발행과 생성의 두 부분으로 구성되어 있다.
- 다른 설계 면접 문제와 마찬가지로, 이번 문제에도 정답은 없다.
- 회사마다 독특한 제약이나 요구조건이 있기 때문에, 시스템을 설계할 때는 그런 점을 고려해야만 한다.
- 설계를 진행하고 기술을 선택할 때는 그 배경에 어떤 타협적 결정들(trade-off)이 있었는지 잘 이해하고 설명할 수 있어야 한다.
