본문 바로가기
카테고리 없음

Embedding 모델 의미 및 핵심 모델 (Word2Vec, SBERT)

by 북더기 2025. 3. 17.

우리가 일상에서 사용하는 단어들은 의미를 가지고 있지만, 컴퓨터에게는 단순한 문자일 뿐입니다. 컴퓨터가 문장을 이해하려면, 단어나 문장을 숫자로 변환해야 합니다. 이때 사용되는 기술이 바로 Embedding 모델입니다.

Embedding 모델은 단어나 문장을 고차원 벡터로 변환하여 컴퓨터가 의미를 이해할 수 있도록 도와줍니다. 쉽게 말해, 단어를 숫자로 바꿔서 연관된 단어끼리 비슷한 숫자 배열을 가지도록 만드는 기술입니다. 예를 들어, "강아지"와 "고양이"는 의미적으로 가깝기 때문에 Embedding 모델에서는 이 둘을 비슷한 벡터 값으로 변환합니다.

 

📌 1. Embedding 모델이 왜 필요할까?

우리가 대화할 때, 단어 하나만 보지 않고 문맥을 고려해서 의미를 이해합니다. 하지만 전통적인 컴퓨터 시스템은 단순히 단어를 기호처럼 취급하기 때문에 문맥을 이해하지 못합니다. Embedding 모델은 이런 한계를 극복하고, 컴퓨터가 문장의 의미를 더 잘 이해할 수 있도록 돕습니다.

🔹 Embedding 모델의 핵심 역할

  • 비슷한 의미의 단어를 가까운 숫자로 표현 → "강아지"와 "고양이"는 비슷한 벡터 값을 가짐
  • 다양한 언어 처리 작업에 활용 → 검색, 번역, 챗봇 등
  • 컴퓨터가 문맥을 이해하도록 도움

Embedding 모델 덕분에 챗봇이 질문을 더 자연스럽게 이해하고, 추천 시스템이 내가 좋아할 만한 영화를 추천할 수 있습니다.

📌 2. 대표적인 Embedding 모델 2가지

🏆 1) Word2Vec – 단어의 관계를 벡터로 표현

Word2Vec은 구글이 2013년에 발표한 모델로, 단어를 벡터로 변환하는 가장 대표적인 기술 중 하나입니다. 단어 간의 관계를 학습해서, 서로 연관된 단어들이 벡터 공간에서 가까운 위치를 가지도록 합니다.

🔹 Word2Vec의 작동 방식

  • CBOW(Continuous Bag of Words): 주변 단어를 보고 중심 단어를 예측
  • Skip-Gram: 중심 단어를 보고 주변 단어를 예측

🔹 예제

문장: "강아지가 공원에서 뛰어놀고 있다."

  • CBOW 방식: ["공원에서", "뛰어놀고"] → "강아지가" 예측
  • Skip-Gram 방식: "강아지가" → ["공원에서", "뛰어놀고"] 예측

Word2Vec 모델은 이런 방식을 통해 단어 간의 의미적 관계를 학습합니다.

🔹 Word2Vec의 장점과 한계

  • 장점: 연산 속도가 빠르고, 단어 간의 유사도를 잘 표현
  • 한계: 문장 전체의 의미를 파악하는 데는 부족함

Word2Vec은 단어 단위로 의미를 분석하는 데 유용하지만, 문장 전체의 의미를 고려하는 데는 한계가 있습니다.

🏆 2) Sentence-BERT(SBERT) – 문장 단위 Embedding

Word2Vec이 단어 단위라면, SBERT는 문장 전체를 분석하는 Embedding 모델입니다. 기존 BERT 모델을 기반으로 문장 수준의 의미를 학습하도록 개선된 모델입니다.

🔹 SBERT의 특징

  • 문장 단위로 의미를 파악할 수 있어 검색 및 질문-응답 시스템에 유용
  • 기존 BERT보다 연산 속도가 빠름
  • 문맥을 반영한 자연스러운 문장 비교 가능

🔹 예제

  • 문장 1: "나는 고양이를 좋아해."
  • 문장 2: "고양이는 나의 최애 동물이야."
  • SBERT Embedding 결과 → 두 문장의 벡터 거리가 가까움 (높은 유사도)

🔹 SBERT의 활용 분야

  • 의미적 검색(Semantic Search)
  • 챗봇 및 자연어 이해
  • 문서 분류 및 추천 시스템

SBERT는 문장 전체의 의미를 고려하기 때문에 검색 엔진이나 Q&A 시스템에서 매우 유용하게 활용됩니다.

🎯 LLM에서 Embedding 모델이 중요한 이유

Embedding 모델은 우리가 AI와 더욱 자연스럽게 상호작용할 수 있도록 해줍니다. Word2Vec과 SBERT 같은 모델 덕분에 챗봇은 사람의 말을 더 잘 이해할 수 있고, 검색 시스템은 더 정확한 정보를 제공할 수 있습니다.

이 기술은 추천 시스템, 감정 분석, 번역, 챗봇 등