본문 바로가기
기록/TIL

[TIL] 231027 - 데브코스 12일차

by 투말치 2023. 10. 27.

목차

    반응형

    학습 내용

    Seaborn : matplotlib을 기반으로 하는 시각화 라이브러리

    - Seaborn을 사용해 시각화 실습 (line plot, bar plot)

     

    WordCloud : 자주 등장하는 텍스트의 중요도나 인기도를 고려해 시각화 하는 것

     

     

    생성 과정 

    1. 자연어 문장에서 키워드 추출 (실습 : KoNLPy 라이브러리로 한국어 문장 전처리)

    2. 키워드가 등장한 빈도 측정 (실습 : Counter를 이용해 빈도 수 측정)

    3. 전처리한 정보와 WordCloud 라이브러리를 바탕으로 WordCloud 생성

     

     

     

    어려웠던 점

    WordCloud 실습을 할 때 font_path 부분에서 자꾸 오류가 났는데 주피터 노트북을 껐다 키니까 해결이 되었다.

    폰트 경로는 폰트 이름을 적으면 된다.

     

    wordcloud = WordCloud(
        font_path='malgun',
        background_color="white",
        height=1000,
        width=1000,
    )

     

    WordCloud 공식 문서

    https://github.com/amueller/word_cloud

     

    GitHub - amueller/word_cloud: A little word cloud generator in Python

    A little word cloud generator in Python. Contribute to amueller/word_cloud development by creating an account on GitHub.

    github.com

     

    느낀 점

    단어의 빈도를 기준으로 시각화를 하니까 확실히 어떤 단어가 많이 사용되었는지 한 눈에 알 수 있었다.

    반응형

    '기록 > TIL' 카테고리의 다른 글

    [TIL] 231031 - 데브코스 16일차  (0) 2023.10.31
    [TIL] 231030 - 데브코스 15일차  (0) 2023.10.30
    [TIL] 231026 - 데브코스 11일차  (0) 2023.10.26
    [TIL] 231025 - 데브코스 10일차  (0) 2023.10.25
    [TIL] 231024 - 데브코스 9일차  (0) 2023.10.24