본문 바로가기

Playdata Analysis 33기

플레이데이터 애널리시스 33기 2달차(~ 10.15) 회고 | 밀린 한달 회고하기🐻

1. 전반적인 느낌(일주일동안 한 일)

근 한달 간 회고를 작성하지 못했다가 오랜만에 작성!!!!!!!
9월 중순 ~ 10월 중순 월간 회고로 봐주세요

SQL파트 끝난 후

Python에서 데이터 분석에 필요한 pandas, numpy 라이브러리를 배웠고

이후, 본격적으로 머신러닝, 딥러닝에 필요한 기초 지식들을 익혀 이번 주부터는 Deeplearning_pytorch를 배우고 있다.
갑자기 난이도가 확 올라감.
이젠 정말 수업에 FULL,, 집중해야한다...

 

 

지난 한달 간 배운 것

<    데이터 분석 파트   >


1) pandas : 데이터 처리와 분석을 위한 라이브러리. 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있음.
2) templagte : Dataframe합치기 , Dataframe 재구조화 - pandas에행렬 데이터를 분석하는 메소드에 대해서 배운 후 dataframe에 대한 학습만 따로 진행
3) 시각화 : matplotlib, 그래프 그리기,Pandas 시각화, seaborn
4) numpy : 벡터, 행열 연산에 필요한 수치를 해석하는 라이브러리.
5) openCV : 이미지 처리, 영상 처리 라이브러리. 이걸 왜 배우나 싶었는데 머신러닝에서 이미지 파일을 입력하고 처리할 때 기반이 되는 라이브러리 수업이였음. 행렬데이터에 대한 이해도 커졌다.

데이터분석 관련된 내용은 BDA 학회를 다니고 인프런에서 공공데이터 분석강의를 수강하면서 접했던 내용이 대부분이라 그래도 할만했는데, 이번 주 부터 들어가는 딥러닝 과정은 정말정말 처음!!!!(지난 학기 인딥개 수업에서 진짜 찍먹만,,)이라서 너무 중요하다!!!!

다음주 중으로 준비하던 공모전 2개가 마무리 되는데,
이제는 수업 내용을 소화하고 관련 미니 프로젝트를 공부하면서 "진짜 내 실력"을 키워야겠다.

이잉 근데 프로그래스 좀 열심히 알걸 ㅜㅜ 알고리즘 좀 열심히할걸 ㅜㅜ 생각이 들긴하나,, 뭐어쩌겟는가 시간은 지났는걸
지금 할 수 있는 것에 집중하는 것이 최선이다..

플레이데이터 커리큘럼이 Python 문법, SQL문법 -> 데이터분석 -> 이미지처리 -> 머신러닝/딥러닝 과정으로 진행되고 있는데,

11월 쯔음에 첫 중간프로젝트가 시작될 것같다. 그래서 10월은 머신러닝/딥러닝 내용을 깊게 이해하는데에 에너지를 쓸 생각이다!


10/23(월)부터는 SQLD자격증 공부를 병행해야하지만,,,

2. 좋았던 점(좋았거나 내가 잘했던 점)

이 시기에 공모전 3개 (아이디어톤 1개 : K-digital Training 해커톤, 모델 생성 :사이버 보안 ai, 데이터 분석 : NH투자증권 빅데이터 경진대회)를 준비했는데 그 과정에서 실제로 내가 수업 때 배운 내용들을 써먹어보는 감을 많이 느낀 것같다.

1) 배운 점:

"도전에 대한 자세 - 견적봐서 할만하면 미쳐라(feat.침착맨)"
나는 무언가를 도전할 때 '가능성'을 신중하게 고민하느라 나중에는 아무것도 도전하지 않은 경우가 있다. 이번에 도전을 두려워하지 않는 좋은 팀원들 덕에 시작의 두려움을 많이 덜고 큰 대회들에도 선뜻 도전해본 것 같다...

"피드백과 소통은 대충 ASAP"
개인적으로 협업을 할 때, 중간 작업물을 선뜻 보여주는 것에 대한 두려움 + 완벽주의로 인한 병적인 미루기 가 나의 가장 안좋은 습관이라고 생각했는데 , 공모전을 통해 그 습관이 덜해진 것같다. 내가 맡은 일을 "제대로"해가야 한다는 모호한 기준때문에 할 일을 많이 미뤘었는데, 팀원들과 얘기를 하다보면 혼자서 있을 때 땅굴파던게 굉장히 쉽게 해결되는 경우가 많았디. + 내가 그렇게 까지 등신은 아니구나,,,같은 생각도,,ㅎㅎ 암튼, 혼자 끙끙거리는 것보다 "현재 진행상황에 대한 인지 -> 공유 -> 재역할분담" 의 과정을 반복하는 것이 협업에 더 도움된다는 것을 알게되는 듯.

"제출에 의의를 둘 것, 어쨌든 성장했다"
공모전을 진행하면서 아직 지식적인 부분에서 큰 부족함을 느꼈다.
사이버 보안 AI에서는 딥러닝 모델의 구조와 라이브러리, 토큰화 , 벡터화 방법을 아예 모르는 채로 "분류 모델"을 생성하려고 하다보니 아주 기초적인 부분부터 독학해야했다. 그러다 보니 수업내용은 놓치고, 새로운 내용은 독학해야하는 비효율적인 학습의 반복,,, 근데 짜치는 걸 제출하기는 싫으니 또 다시 input, input,,,, 인풋중독에 빠지지 말고 현재 할 수 있는 수준에서 정리해서 내는 것도 능력이였다. 그렇게 한번 해보고 나면 다음에는 더 잘할수있으니 걱정말고 제발 그냥 제출!!하기


" 데이터분석 경진대회는 도메인이 익숙할수록 할만하다!!!!"
NH투자증권 경진대회를 진행하면서,,, 주식을 해본적이 없으니 데이터 EDA 및 전처리 과정에서 어떤 Feature를 써야하는지 전혀 감이 잡히지 않았다! 그래서 공부와 구글링으로 퀀트 전략, 가치 지표(Kospi200,PER, EPS)등을 공부하는 과정에 시간을 너무 많이썼다!!(데이터 분석보다 더씀)
강사님도 feature를 선택하는 건 분석가의 도메인 지식과 경험적 감이 중요하다고 했기 때문에 다음 경진 대회에서는 좀 더 익숙한 분야로 선택해서 공부해야겠다.

3. 아쉬웠던 점

9월 중순부터 여러가지 일들이 한번에 겹쳐서 수업 내용을 소화하는데 쓰는 시간이 줄었다는 점이 가장 아쉽다.
중국 여행으로 인해 3일정도 출석을 하지 못했고,
K-digital Training 해커톤에 참가하면서 수업 앞 뒤로 회의와 수업복습스터디를 진행하느라 정말정말 바빴다...
심지어 이번 주에는 공모전만 2개,,
사이버보안ai, NH투자증권 경진대회에 참여하면서 깃허브 찾아보고 주식도메인 지식을 공부하고,,ㅜㅜㅜ
이런 상황들이 반복되면서 현재 집중할 대상을 줄여야한다는 것을 실감한다.
우선순위를 고려하라 고려하라 하는데 나는 동시에 너무 여러개를 하려고 한다는 게 제일 문제인 듯

4. 개선할 점

한 번에 한가지 일만 할 것
수업 복습 1시간 + 프로그래머스 문제풀이 30분 을 기반으로
개인프로젝트 + 선형대수 공부를 셔플해서 공부하기,,,

5. 다음 달 계획

ML/DL + 데이터분석 공부
[데이콘][📓python 튜토리얼](https://dacon.io/competitions/official/235698/overview/description)
[프로그래머스] 파이썬 문제풀이 Day 5~10
[코드잇] 인강 듣기 데이터 분석(2개)+ 머신러닝(5개) + 딥러닝(1개) → 공모전에 필요한 지식 공부

SQLD 자격증 따기
10 /23(월) 시작 4주 스터디

본격적인 알고리즘 공부는 11월에 프로그래머스 문제양을 늘리면서 보완할 것
프로그래머스 기초문제를 푸는 것 자체가 알고리즘 공부