⭐오늘 진행한 것
- 단어사전 기반으로 모델링Kobert 진행 완료
Kobert 레퍼런스 :
https://velog.io/@fhflwhwl5/Python-KoBERT-7가지-감정%[…]류모델-구현하기
✔️Trial and Error
Kobert 모델 import 안되는 문제 발생 → hugging face에서 불러와서 해결 완료
📝느낀 점
감정분석 모델은 긍/부정으로만 나뉘는 모델만 알고 있었는데
다중 분류를 위해서 새로운 모델인 Kobert모델을 직접 모델링할 수 있어서 좋은 기회였다.
다만 감정사전을 직접 구축하는 단계를 추가해야 완벽히 감정분석을 익힐 수 있을 듯
파이썬 버전이 바뀌면서 모델이 안돌아가서 너무 당황했지만 코드 수정으로 해결! 뿌듯했음
🚩 다음 할 일 :
단어 사전 구축(목표 : 금~다음주 월) → 감성분류모델에 재학습시켜서 모델정확도(목표 0.8이상) 높이기 (목표 : 다음주 화~수)
- 라벨링 기준 정하기 → 각자 레퍼런스 찾아와서 방법 공유하기 ⭐다음주 월
- 데이터 셋 문장에 라벨링해서 하나의 파일로 만들기
- 데이터 셋목표:20만개
- 현재 데이터 셋
- [aihub]감성 대화 말뭉치 final_emotion (58271) / 기쁨, 당황 , 분노, 슬픔, 상처 - 5
- [aihub]한국어 단발성 대화 데이터셋 (38595) / 공포, 놀람, 분노, 슬픔, 중립, 행복, 혐오 - 7개
- [aihub]한국어 연속성 대화 데이터셋(55630) /행복, 중립, 슬픔, 공포, 혐오, 분노, 놀람 - 7개
- chatbotdata(11824) / 0 중립 1 이별 2 사랑(긍부정 모두 포함)
🚩다음주까지 할 일:
- 노래 - 감정 과 일기 - 감정 코사인 유사도 기반으로 추천시스템 만들기**(다음주 목~금)**
- 모델링 결과 기반으로 streamlit으로 화면 구현
'Playdata Analysis 33기' 카테고리의 다른 글
231115 TIL | 미니프로젝트 - 3 (0) | 2023.11.16 |
---|---|
231114 TIL | 미니프로젝트 - 2 (0) | 2023.11.16 |
231113 TIL | 미니프로젝트 - 1 (0) | 2023.11.13 |
플레이데이터 애널리시스 33기 11월 1주차(10/30 ~ 11/03) 회고 (1) | 2023.11.06 |
플레이데이터 애널리시스 33기 10월 4주차(10/23 ~ 10/29) 회고 (1) | 2023.10.31 |