안녕하세요 다음주 과제 공지 합니다.
- 다음주 12/4 송년회 일정으로 인해 12/5 스터디는 없습니다
코로나 상황을 보고 송년회 추진 여부를 다시 알려드리겠습니다.\
- NLP 강의
- BERT(용선)
- 실습 과제
- 한국어 챗봇데이터로 Transformer 구축하기
- 데이터 : https://github.com/changwookjun/ChatBot_seq2seq
- 다음 스터디 내용
- 1~2교시 : 정부 사업 추진 내용(준규)
- 2~3교시 : 공간 분석(정윤)
안녕하세요 다음주 과제 공지합니다.
스터디 일정을 조정했습니다.
12/5(전일 송년회), 12/26(크리스마스 연휴), 1/2(신년 연휴)는 스터디를 하지 않도록 할게요.
한해 마무리 잘 하시기 바랍니다.
-
NLP 강의
- 범위 : GPT(종현)
-
실실습 과제 : 네이버 리뷰 감정분석
- 가능하신분은 BERT를 미리 적용하여 감정분석 해보세요!
- 네이버 리뷰 데이터
- 데이터 : https://github.com/e9t/nsmc
- 참고 도서 : 텐서플로 2와 머신러닝으로 시작하는 자연어처리(위키북스)
- 차주 스터디 내용
- 1~2교시 : Transformer Decoder(호재) 및 GPT(종현)
- 2~3교시 : 의료 이미지 학습(주형)
이번주 학습 내용은 "ELMO" 입니다.
강의를 듣고 동작하는 방식에 대해 고민하고 오세요.
과제는 이전 한국어 챗봇 데이터를 Transformer 로 구성하는 것입니다.
추천해드린 책에 답지가 있으니 참고하시면 됩니다.
-
NLP 강의
- 범위 : ELMO(현욱)
-
실실습 과제 : 한국어 챗봇만들기(Seq2Seq)
- 아래 링크에 가시면 한국어 질의응답데이터가 있습니다.
- 예제도 함께 올려드리니 한국어 챗봇 만들기에 도전해주세요.
- 챗봇 데이터로 Transformer를 만들어주세요
- 데이터 : https://github.com/changwookjun/ChatBot_seq2seq
- 차주 스터디 내용
- 1~2교시 : ELMO(현욱), 프로젝트 토론
- 2~3교시 : NLP 논문 소개(호섭)
안녕하세요 다음주 과제 공지합니다.
다음주부터 12월12일까지 모임장소는 코지모임공간 강남2호점 6층 space1입니다
- 최신 NLP 모델에 근간이 되는 Transformer에 대해 공부하는 주입니다. 매우 중요한 파트이니 내용 이해에 최대한 집중해주세요.
- 실습은 전주에 한국어 Chatbot 만들기(Seq2Seq)를 연장하겠습니다.
- 그 다음주는 Transformer로 만드는 겁니다.
-
NLP 강의
- 범위 : Transformer(8-2, 호재)
-
실실습 과제 : 한국어 챗봇만들기(Seq2Seq)
- 아래 링크에 가시면 한국어 질의응답데이터가 있습니다.
- 예제도 함께 올려드리니 한국어 챗봇 만들기에 도전해주세요.
- 데이터 : https://github.com/changwookjun/ChatBot_seq2seq
- 예제 : Seq2Seq https://github.com/changwookjun/ChatBot_seq2seq_extend
- 차주 스터디 내용
- 1~2교시 : Transformer(호재)
- 2~3교시 : Docker 실습(태진)
안녕하세요 다음주 과제 공지합니다.
유튜브 영상 2개와 실습 과제 입니다. 지난주 실습 과제 제출 안하신 분은 Github에 제출해주세요.
-
NLP 강의
- Seq2Seq(8-1), Transformer(8-2)
- Seq2Seq는 다음주에 리뷰하겠지만, Transformer는 2주 뒤에 리뷰 할 예정입니다.
- 중요하고 어려운 내용이다보니 시간을 가지고 고민해봤으면 좋겠습니다.
-
실습 과제 : 한국어 챗봇만들기(Seq2Seq)
- 아래 링크에 가시면 한국어 질의응답데이터가 있습니다.
- 예제도 함께 올려드리니 한국어 챗봇 만들기에 도전해주세요. - 데이터 : https://github.com/changwookjun/ChatBot_seq2seq - 예제 : Seq2Seq https://github.com/changwookjun/ChatBot_seq2seq_extend
-
프로젝트 준비
- 영진님이 오늘 공유된 프로젝트 투표 올려주면, 관심 있는 것들을 투표해주세요(중복 투표 가능). - =- 다음주에 최종 확정할게요.
-
다음주 내용
- 1~2교시 : NLP 내용 학습 (차원 축소(종현), Seq2Seq(용선))
- 2~3교시 : 현우님 세미나(어플리케이션 내 머신러닝 적용)
안녕하세요 다음주 과제 공지합니다.
유튜브 강의(4시간)와 실습이 있어 부지런히 움직이셔야합니다.
-
NLP 강의
- 범위 :유튜브 영상 8번(05 Text Representation) ~ 13번(06 Dimensionality_Reduction)
- Text Representation(용선), Dimensionality_Reduction(종현)
-
실습 과제 : 실습 과제는 깃헙에 올려주세요.(https://github.com/ds-study-gangnam)
- Popcorn 데이터(캐글 제출까지)
- 네이버 리뷰 데이터
- 데이터 : https://github.com/e9t/nsmc
- 참고 도서 : 텐서플로 2와 머신러닝으로 시작하는 자연어처리(위키북스)
- 참고 코드
- https://cyc1am3n.github.io/2018/11/10/classifying_korean_movie_review.html
안녕하세요 다음주는 유튜브 영상 없이 NLP 실습만 있습니다. 아래 내용 보시고 스터디 해오세요~
-
[NLP 실습 (NLTK, Tensorflow or Pytorch 등)]
- 캐글 팝콘 대회(https://www.kaggle.com/c/word2vec-nlp-tutorial)
- 데이터 전처리(토크나이징, POS tagging 등) 다양하게 해볼것
- 모델링 필사(Tensorflow or pytorch) https://www.kaggle.com/rajmehra03/a-detailed-explanation-of-keras-embedding-layer
-
차주 세미나 내용
- 1교시(9시~10시) : NLP 실습 내용 리뷰
- 2교시(10시~11시) : 종현님 이야기(축구 데이터 분석)
- 3교시(11시~12시) : 프로젝트 구상(영진님 외)
-
수정
- 종현님, 태진님 세미나(실습포함)
- 10/31 프로젝트 내용 공유
- 11/7 현우님
-
이번주 실습 하실때 혹시 도움이 될까 해서 남깁니다.
- 용선님 전처리 연습한 코드입니다. 참고하세요
- https://github.com/YongseonKim/Natural-Language-Processing/tree/main/01_Bags_of_Popcorn
- 다음주와 다다음주는 스터디가 없습니다.
- 3주뒤 스터디에서는 Text 데이터 전처리와 표현 부분에 대해 이야기 나눌 예정입니다. 강의 듣고 오세요~
- 아래 링크 02~ 05 강의 입니다.
- 번호로는 4~11번 입니다.(약 4시간)
- https://www.youtube.com/playlist?list=PLetSlH8YjIfVzHuSXtG4jAC2zbEAErXWm
- 다음주 NLP 강의는 아래 링크 접속하셔서 01-1,2 Introduction to Text Analtics 약 2시간 강의를 듣고 오시면 됩니다.
- 강의 https://www.youtube.com/playlist?list=PLetSlH8YjIfVzHuSXtG4jAC2zbEAErXWm
- 교재 https://github.com/pilsung-kang/text-analytics
- 1시간 반정도 이론 이야기 하고 나머지 1시간 반은 태진님께서 깃헙 소개(관리법 등) 해주실거에요