Skip to content

Commit

Permalink
add links
Browse files Browse the repository at this point in the history
  • Loading branch information
emphasis10 committed Apr 13, 2024
1 parent 9606e1f commit 410f31d
Showing 1 changed file with 1 addition and 0 deletions.
1 change: 1 addition & 0 deletions summaries/2404.05961.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,7 @@
## TL;DR
## Summary
- [https://arxiv.org/pdf/2404.05961.pdf](https://arxiv.org/pdf/2404.05961.pdf)
- [https://github.com/McGill-NLP/llm2vec](https://github.com/McGill-NLP/llm2vec)

이 문서는 "LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders"이라는 제목으로, 대규모 언어 모델(대규모 디코더 전용 언어 모델)이 최신 NLP(자연언어 처리) 작업에서 우수한 성능을 보이고 있음에도 불구하고, 텍스트 임베딩 작업(복잡한 문맥을 표현하는 작업)에는 덜 활용되고 있다고 언급합니다. 특히, 이 연구에서는 LLM2Vec라는 간단하지만 효과적인 비지도 방식을 소개하여, 모든 디코더 전용 대규모 언어 모델을 강력한 텍스트 인코더로 전환할 수 있는 방법을 제시합니다. LLM2Vec는 크게 세 단계로 구성되어 있으며, 이를 통해 언어 모델을 조정하여 높은 성능의 텍스트 임베딩 모델을 구축함을 입증합니다. 이 방법은 텍스트의 '전방 및 후방 문맥'을 고려하여 풍부하고 복잡한 문맥 정보를 포착할 수 있도록 돕습니다. 연구에서는 각기 다른 파라미터 크기(1.3B에서 7B)를 가지는 세 가지 대규모 언어 모델에 LLM2Vec 방법을 적용하고, 단어 및 문장 수준 작업에 대한 모델의 성능을 평가합니다. 결과적으로, 이 연구방법은 기존 인코더 전용 모델을 능가하는 새로운 비지도 성능 기준을 설정하고, 공개된 데이터만을 사용한 모델 중 최상의 성능을 달성함을 보여줍니다.

Expand Down

0 comments on commit 410f31d

Please sign in to comment.