본문 바로가기

Playdata Analysis 33기

231116 TIL | 미니프로젝트 - 4

오늘 진행한 것

  • 단어사전 기반으로 모델링Kobert 진행 완료

Kobert 레퍼런스 :

https://velog.io/@fhflwhwl5/Python-KoBERT-7가지-감정%[…]류모델-구현하기


✔️Trial and Error

Kobert 모델 import 안되는 문제 발생 → hugging face에서 불러와서 해결 완료


📝느낀 점

감정분석 모델은 긍/부정으로만 나뉘는 모델만 알고 있었는데

다중 분류를 위해서 새로운 모델인 Kobert모델을 직접 모델링할 수 있어서 좋은 기회였다.

다만 감정사전을 직접 구축하는 단계를 추가해야 완벽히 감정분석을 익힐 수 있을 듯

파이썬 버전이 바뀌면서 모델이 안돌아가서 너무 당황했지만 코드 수정으로 해결! 뿌듯했음


🚩 다음 할 일 :

단어 사전 구축(목표 : 금~다음주 월) → 감성분류모델에 재학습시켜서 모델정확도(목표 0.8이상) 높이기 (목표 : 다음주 화~수)

  1. 라벨링 기준 정하기 → 각자 레퍼런스 찾아와서 방법 공유하기 ⭐다음주 월
  2. 데이터 셋 문장에 라벨링해서 하나의 파일로 만들기
  • 데이터 셋목표:20만개
  • 현재 데이터 셋
  1. [aihub]감성 대화 말뭉치 final_emotion (58271) / 기쁨, 당황 , 분노, 슬픔, 상처 - 5
  2. [aihub]한국어 단발성 대화 데이터셋 (38595) / 공포, 놀람, 분노, 슬픔, 중립, 행복, 혐오 - 7개
  3. [aihub]한국어 연속성 대화 데이터셋(55630) /행복, 중립, 슬픔, 공포, 혐오, 분노, 놀람 - 7개
  4. chatbotdata(11824) / 0 중립 1 이별 2 사랑(긍부정 모두 포함)

🚩다음주까지 할 일:

  1. 노래 - 감정 과 일기 - 감정 코사인 유사도 기반으로 추천시스템 만들기**(다음주 목~금)**
  2. 모델링 결과 기반으로 streamlit으로 화면 구현