추천 알고리즘 원리, 유튜브는 왜 내 취향을 너무 잘 알까요?

퇴근하고 침대에 누워서 유튜브를 켰는데, 이상하게 딱 보고 싶던 영상이 떠요. 어제는 운동화 리뷰를 봤는데 오늘은 러닝 자세 영상이 나오고, 쇼츠 하나 봤을 뿐인데 비슷한 영상이 줄줄이 따라오죠. 이쯤 되면 살짝 무서워져요.

“얘네 내 머릿속 읽나?”

전혀 아니에요. 유튜브가 독심술을 쓰는 게 아니라, 우리가 남긴 작은 행동 조각을 엄청 빠르게 맞춰보는 거예요. 오늘은 추천 알고리즘이 어떻게 “이 사람은 이걸 볼 확률이 높다”라고 판단하는지, 최대한 사람 말로 풀어볼게요.

🛒 추천 알고리즘은 동네 편의점 사장님 같아요

추천 알고리즘을 어렵게 생각하지 말고, 단골 많은 편의점 사장님을 떠올려보면 쉬워요.

어떤 손님이 매주 금요일 밤마다 컵라면, 탄산음료, 감자칩을 사 간다고 해볼게요. 어느 날 그 손님이 들어오면 사장님은 속으로 생각하겠죠.

“아, 이 사람 오늘도 야식 각이네.”

추천 알고리즘도 비슷해요. 단지 사장님보다 훨씬 많은 손님을 보고, 훨씬 많은 행동을 기억해요.

편의점 사장님	추천 알고리즘
자주 사는 물건을 기억해요	자주 보는 영상을 기억해요
비슷한 손님 취향을 떠올려요	비슷한 이용자 패턴을 찾아요
새로 들어온 상품을 권해요	새 영상 중 볼 만한 걸 띄워요

여기서 중요한 건 “좋은 영상”을 고르는 게 아니라는 점이에요. 알고리즘의 질문은 보통 이쪽에 가까워요.

“이 사람이 지금 이 영상을 클릭하고, 오래 보고, 만족할 가능성이 얼마나 높을까?”

즉 추천은 객관식 시험 정답 찾기가 아니라, 확률 높은 선택지를 앞줄에 세우는 일이에요.

👥 나랑 비슷한 사람이 본 걸 보여주는 방식

가장 유명한 추천 방식 중 하나가 협업 필터링이에요. 이름은 딱딱한데 원리는 단순해요.

가령 A와 B가 둘 다 고양이 영상, 카페 브이로그, 아이패드 리뷰를 봤어요. 그런데 A는 새로 올라온 책상 꾸미기 영상도 끝까지 봤고, B는 아직 안 봤어요. 그러면 알고리즘은 이렇게 생각할 수 있어요.

“B도 저 책상 꾸미기 영상 좋아할 확률이 있겠네?”

이게 협업 필터링이에요. 콘텐츠의 내용을 깊게 이해하기보다, 사람들의 행동 패턴이 닮았는지를 보는 방식이죠.

넷플릭스가 2006년에 연 추천 알고리즘 대회도 이 흐름과 관련이 깊어요. 참가자들은 이용자의 영화 평점 데이터를 바탕으로 다음 평점을 더 잘 예측하려고 경쟁했고, 2009년 BellKor’s Pragmatic Chaos 팀이 넷플릭스 기존 알고리즘보다 약 10% 나은 성능으로 100만 달러 상을 받았어요.

신기한 건 이거예요. 추천 알고리즘은 “너는 이런 사람이야”라고 이름표를 붙이지 않아도 돼요. 그냥 수많은 클릭, 시청 시간, 평점, 건너뛰기 같은 행동을 점으로 찍고, 그 점들이 가까운 사람끼리 묶으면 돼요.

🎬 영상 자체를 읽는 방식도 있어요

그런데 협업 필터링만 쓰면 문제가 생겨요. 새로 올라온 영상은 아직 본 사람이 별로 없잖아요. 그러면 “비슷한 사람이 봤다”는 힌트가 부족해요. 이걸 흔히 콜드 스타트 문제라고 해요. 차가운 엔진을 처음 켤 때처럼, 데이터가 부족해서 추천이 잘 안 걸리는 상황이에요.

그래서 알고리즘은 영상 자체도 봐요. 제목, 설명, 자막, 썸네일, 채널 주제, 업로드 시간 같은 것들이 힌트가 돼요.

예를 들어 이런 영상이 있다고 해볼게요.

제목: “초보 러너가 5km 뛰기 전에 꼭 알아야 할 것”
설명: 러닝화, 무릎 통증, 페이스 조절 언급
시청자 반응: 초반 이탈 적고 댓글 많음

그러면 알고리즘은 이 영상을 “러닝 입문자에게 맞는 영상” 쪽으로 분류할 수 있어요. 그리고 최근에 러닝화 리뷰를 본 사람, 마라톤 브이로그를 본 사람, 운동 루틴 영상을 저장한 사람에게 테스트하듯 보여줄 수 있죠.

이 방식은 콘텐츠 기반 추천에 가까워요. “이 사람이 좋아한 콘텐츠와 비슷한 콘텐츠를 찾아주자”는 생각이에요.

🧮 어려운 핵심: 추천은 두 번 고르는 게임이에요

유튜브 추천 시스템을 설명한 2016년 논문에서는 추천 과정을 크게 두 단계로 나눠 설명해요. 첫 번째는 후보를 뽑는 단계, 두 번째는 순위를 매기는 단계예요.

이걸 식당 메뉴판으로 비유해볼게요. 전 세계 모든 음식 중에서 오늘 저녁을 고르라고 하면 너무 많죠. 먼저 “한식, 일식, 분식 중에서 고르자”처럼 후보를 줄여야 해요. 그다음 후보 안에서 김치찌개, 돈가스, 떡볶이 순서를 정하는 거예요.

유튜브도 비슷해요.

단계	하는 일	비유
후보 생성	수많은 영상 중 볼 만한 후보를 몇백 개로 줄여요	메뉴판 압축
랭킹	후보 영상의 순서를 정해요	오늘 제일 끌리는 메뉴 고르기

여기서 랭킹은 단순히 조회수 높은 순서가 아니에요. 클릭할 확률, 오래 볼 확률, 최근 관심사, 영상 신선도, 채널 선호도 같은 신호를 섞어 계산해요. 유튜브 논문도 후보 생성과 랭킹을 분리한 구조를 설명하고, 시청 시간 같은 지표를 중요하게 다뤄요.

아주 단순하게 쓰면 이런 느낌이에요.

s c o r e = c l i c k + w a t c h + s a t i s f a c t i o n

이 수식은 실제 유튜브 공식 계산식이 아니라 설명용이에요. 뜻은 간단해요. “누를 것 같은가?”, “오래 볼 것 같은가?”, “보고 나서 괜찮았다고 판단할 수 있는가?” 같은 점수를 합쳐서 앞에 놓는다는 뜻이에요.

🧲 그래서 왜 한 번 보면 계속 따라올까요?

알고리즘은 확신이 없을 때 작은 실험을 해요. 내가 갑자기 캠핑 영상을 하나 눌렀다면, 알고리즘은 바로 캠핑 덕후라고 확정하지 않아요. 대신 캠핑 장비 리뷰, 차박 브이로그, 캠핑장 추천 영상을 조금씩 던져봐요.

여기서 내가 오래 보면 “아, 관심 있네”라고 보고 더 보여줘요. 바로 넘기면 관심도를 낮춰요. 그래서 유튜브 피드는 고정된 신문 1면이 아니라, 계속 반응을 보며 바뀌는 전광판에 가까워요.

문제는 이게 너무 잘 맞을 때예요. 내가 비슷한 영상만 계속 보면 알고리즘도 비슷한 영상만 더 줘요. 그러면 취향이 넓어지는 게 아니라 좁은 골목으로 들어갈 수 있어요. 이걸 흔히 필터 버블이라고 불러요.

💡 추천을 조금 바꾸고 싶다면 검색어를 바꾸는 것보다 “끝까지 보는 영상”을 바꾸는 게 더 강해요.

알고리즘 입장에서는 검색 한 번보다 반복 시청이 더 진한 신호거든요. 관심 없는 영상은 빠르게 넘기고, 새로 보고 싶은 분야 영상은 몇 개 끝까지 보면 피드가 꽤 빨리 흔들려요.

🧠 추천 알고리즘은 취향을 맞히는 게 아니라 만들어가요

추천 알고리즘은 내 취향을 완성된 지도처럼 꺼내 보는 기술이 아니에요. 오히려 내가 남긴 발자국을 보고 “다음 발은 이쪽일까?” 하고 계속 예측하는 기술에 가까워요.

처음엔 내가 영상을 고르는 것 같지만, 시간이 지나면 추천 목록이 내가 볼 선택지를 좁혀요. 그래서 알고리즘은 거울이면서 동시에 메뉴판이에요. 나를 비추기도 하고, 내가 고를 수 있는 것을 미리 진열하기도 하죠.

유튜브가 내 취향을 너무 잘 아는 것처럼 느껴지는 이유는 단순해요. 내가 이미 아주 많은 힌트를 줬기 때문이에요. 클릭, 정지, 되감기, 끝까지 보기, 바로 넘기기. 전부 작은 대답이었거든요.

다음에 피드가 또 소름 끼치게 잘 맞으면 이렇게 생각하면 돼요. “아, 얘가 또 내 발자국 주워서 메뉴판 짰네.” 그 정도 거리감이면 충분해요. 👋

📚 참고 자료

Paul Covington, Jay Adams, Emre Sargin, “Deep Neural Networks for YouTube Recommendations”, ACM RecSys 2016 / Google Research
Google Research Publications, “Deep Neural Networks for YouTube Recommendations”
Netflix Prize 공식 기록 및 2009년 수상 자료
Wired, “BellKor's Pragmatic Chaos Wins $1 Million Netflix Prize by Mere Minutes”, 2009