2023. 11. 6. 16:56ใML&DL/NLP
๐
FFNN์ ์ธ๊ณต ์ ๊ฒฝ๋ง์ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํํ์ด๋ฉฐ, MLP๋ ๋ค์ธต ํผ์ ํธ๋ก ์ ๋ปํ๋ฉฐ ์๋์ธต์ด ์๋ FFNN ์ ํ ์ค ํ๋.
RNN์ FFNN๊ณผ ๋ฌ๋ฆฌ ์ํ ๊ตฌ์กฐ๋ก ์ด๋ฃจ์ด์ ธ ์๊ธฐ ๋๋ฌธ์ ์ด์ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ํ์ฌ ์์ ์ ๋ฐ์ํ๋ฏ๋ก ์์ฐจ์ ์ธ ๋ฐ์ดํฐ์ ํจ๊ณผ์ ์.
+) RNN์ ๋จ์ ์ ๋ณด์ํ๊ธฐ ์ํด ๋์จ LSTM ๋ชจ๋ธ , LSTM์ ๊ฐ์ ํ GRU ๋ชจ๋ธ ๋ฑ ๋ค์ํ ์ํ์ค ๋ชจ๋ธ์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
1. Feed Forward Neural Network (์๋ฐฉํฅ ์ ๊ฒฝ๋ง)
- ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ต์ด ์ ํ์ด์. ๊ฐ์ฅ ๋จ์ํ ํํ
- MLP๋ FFNN(Feed Forward Neural Network)์ ํ ์ ํ
- ์ ๋ ฅ ๋ ธ๋๋ก๋ถํฐ ์ถ๋ ฅ ๋ ธ๋ ๋ฐฉํฅ์ผ๋ก ํ ๋ฐฉํฅ(์๋ฐฉํฅ)์ผ๋ก๋ง ์์ง์.
- ์ ๋ ฅ์ธก -> ์๋์ธต -> ์ถ๋ ฅ์ธต
- ๋จ์ธต ํผ์ ํธ๋ก (์๋ ๋ ธ๋ x)
- ๋ค์ธต ํผ์ ํธ๋ก (์๋ ๋ ธ๋ o)
2. RNN(Recurrent Neural Network) - ์ํ ์ ๊ฒฝ๋ง
- ์ ๋ ฅ๊ณผ ์ถ๋ ฅ์ ์ํ์ค ๋จ์๋ก ์ฒ๋ฆฌํ๋ ์ํ์ค(Sequence) ๋ชจ๋ธ
- ์ ๋ ฅ์ ๊ธธ์ด๋งํผ ์ ๊ฒฝ๋ง์ด ํผ์ณ์ง
- ์ ๋ ฅ๋ฐ๋ ๊ฐ ์๊ฐ์ ์์ (time step) ์ด๋ผ๊ณ ํจ - ์์ฐ์ด ์ฒ๋ฆฌ์์ ๊ฐ ์์ ์ ์ ๋ ฅ์ ๋จ์ด ๋ฒกํฐ or ํํ์ ๋ฒกํฐ
- ์ ๋ ฅ๊ณผ ์ถ๋ ฅ์ ๊ธธ์ด์ ๋ฐ๋ผ RNN ํํ๊ฐ ๋ฌ๋ผ์ง (์ผ๋๋ค/ ๋ค๋์ผ/๋ค๋๋ค)
ex) ์ผ๋๋ค - ์ฌ์ง์ ์ ๋ชฉ(์ด๋ฏธ์ง ์บก์ ๋) , ๋ค๋์ผ - ์คํธ ๋ฉ์ผ ๋ถ๋ฅ, ๋ค๋๋ค - ์ฑ๋ด
์ (cell)
- ์๋์ธต์ ์๋ RNN์ ์ฒ๋ฆฌ ๋จ์.
- ์ ์ ์ถ๋ ฅ์ ์๋ ์ํ(hidden state) ๋ผ๊ณ ํจ
- RNN์ ์์ (time step)์ ๋ฐ๋ผ์ ์ ๋ ฅ์ ๋ฐ๋๋ฐ ํ์ฌ ์์ ์ ์ฐ์ฐ์ ์ํด ์ง์ ์์ ์ ์ ๋ ฅ ๋ฐ์
-> RNN์ ๊ณผ๊ฑฐ์ ์ ๋ณด๋ฅผ ํ์ฌ์ ๋ฐ์ํ์ฌ ํ์ตํ๋ ๋ชจ๋ธ. ์์ฐจ์ ์ธ ๋ฐ์ดํฐ์ ํจ๊ณผ์ ์
RNN ์ ๋ฌธ์ ์
- ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ : ์์ ์ด ๊ธธ์ด์ง๋ฉด์ ์์ ์๋ ์ ๋ณด๊ฐ ์์ค๋๋ ๋ฌธ์
3. LSTM (Long Short-Term Memory)
- ๊ธฐ์กด RNN์ ๋ณํํ์ฌ ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ๋ฅผ ๋ณด์ํ ๋ชจ๋ธ
- RNN ๋ณด๋ค ๊ธด ์ํ์ค์ ์ ๋ ฅ์ ์ฒ๋ฆฌํ๋๋ฐ ํ์ํ ์ฑ๋ฅ์ ๋ณด์
- RNN์ ์์๋ Cell State ๋ผ๋ ๊ฐ๋ ์ด ์ถ๊ฐ (RNN์ hidden state๋ง, LSTM ์ hidden state+Cell State )
- ์๊ทธ๋ชจ์ด๋ ํจ์ (0~1) ์์ ํ์ดํผ๋ณผ๋ฆญํ์ ํธ ํจ์(-1 ~ 1 ) ์ง๋์จ ๋ ๊ฐ์ง ๊ฐ์ Cell state ์ ๋ฐ์
์ญ์ ๊ฒ์ดํธ / ์ ๋ ฅ ๊ฒ์ดํธ / ์ถ๋ ฅ ๊ฒ์ดํธ
- ์ญ์ ๊ฒ์ดํธ : ์ด์ ์์ ์ ์ ๋ ฅ์ ์ผ๋ง๋ ๋ฐ์ํ ์ง ๊ฒฐ์
- ์ ๋ ฅ ๊ฒ์ดํธ : ํ์ฌ ์์ ์ ์ ๋ ฅ์ ์ผ๋ง๋ ๋ฐ์ํ ์ง ๊ฒฐ์
- ์ถ๋ ฅ ๊ฒ์ดํธ : Hidden State๋ฅผ ์ฐ์ฐํ๋ ์ผ์ ์ฌ์ฉ
4. GRU(Gated Recurrent Unit)
- LSTM์ ๋ณต์ก๋๋ฅผ ์ค์ธ ๋ชจ๋ธ.
- 3๊ฐ์ ๊ฒ์ดํธ๊ฐ ์๋ LSTM์ ๋ฌ๋ฆฌ 2๊ฐ์ ๊ฒ์ดํธ๊ฐ ์์ (์ ๋ฐ์ดํธ ๊ฒ์ดํธ, ๋ฆฌ์ ๊ฒ์ดํธ)
'ML&DL > NLP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[NLP] Pre-trained Language Model(PLM) (0) | 2023.11.07 |
---|---|
[NLP] Seq2Seq(Sequence-to-Sequence) (0) | 2023.11.06 |
[NLP] ํ ์คํธ ๋ฒกํฐํ : ์๋ ์๋ฒ ๋ฉ(Word embedding) ์ค์ต (1) | 2023.11.03 |
[NLP] ํ ์คํธ ๋ฒกํฐํ : TF-IDF ์ค์ต (1) | 2023.11.03 |
[NLP] ํ ์คํธ ๋ฒกํฐํ (0) | 2023.11.03 |