머신러닝, 언어 이해, 통계 등을 활용해 모델을 수립하고 정보를 추출해 BI나 예측 분석 등의 분석 작업을 주로 수행
활용 분야

텍스트 데이터를 피처 형태로 추출하고 추철된 피처에 의미 있는 값을 부여하는 과정이 필요
⇒ 피처 벡터화, 피처 추출

NLTK(Natural Language Toolkit for Python)
파이썬의 가장 대표적인 NLP 패키지
그러나 수행 속도 측면에서 아쉬운 부분이 존재
→ 대량 데이터 기반에서는 활용도가 떨어짐
Genism
Word2Vec도 지원SpaCy