목차
반응형
학습 내용
Seaborn : matplotlib을 기반으로 하는 시각화 라이브러리
- Seaborn을 사용해 시각화 실습 (line plot, bar plot)
WordCloud : 자주 등장하는 텍스트의 중요도나 인기도를 고려해 시각화 하는 것
생성 과정
1. 자연어 문장에서 키워드 추출 (실습 : KoNLPy 라이브러리로 한국어 문장 전처리)
2. 키워드가 등장한 빈도 측정 (실습 : Counter를 이용해 빈도 수 측정)
3. 전처리한 정보와 WordCloud 라이브러리를 바탕으로 WordCloud 생성
어려웠던 점
WordCloud 실습을 할 때 font_path 부분에서 자꾸 오류가 났는데 주피터 노트북을 껐다 키니까 해결이 되었다.
폰트 경로는 폰트 이름을 적으면 된다.
wordcloud = WordCloud(
font_path='malgun',
background_color="white",
height=1000,
width=1000,
)
WordCloud 공식 문서
https://github.com/amueller/word_cloud
느낀 점
단어의 빈도를 기준으로 시각화를 하니까 확실히 어떤 단어가 많이 사용되었는지 한 눈에 알 수 있었다.
반응형
'기록 > TIL' 카테고리의 다른 글
[TIL] 231031 - 데브코스 16일차 (0) | 2023.10.31 |
---|---|
[TIL] 231030 - 데브코스 15일차 (0) | 2023.10.30 |
[TIL] 231026 - 데브코스 11일차 (0) | 2023.10.26 |
[TIL] 231025 - 데브코스 10일차 (0) | 2023.10.25 |
[TIL] 231024 - 데브코스 9일차 (0) | 2023.10.24 |