10-1. 임베딩(Embedding)

10-1-1. 희소 표현 기반 임베딩

희소 표현(sparse representation)

원-핫 인코딩

단점

  1. 원-핫 벡터들은 하나의 요소만 1 값을 가지고 나머지는 모두 0인 희소 벡터(sparse vector)를 가짐
  2. 차원의 저주 문제

⇒ 신경망 기반 단어 벡터화 방법들이 주목을 받고 있음

10-1-2. 횟수 기반 임베딩

카운터 벡터(Counter Vector)