전이 학습을 진행하려고 하는데

by 3838seungsheon - opened Dec 28, 2023

Discussion

3838seungsheon

Dec 28, 2023

generation_config.json, special_tokens_map.json, tokenizer_config.json, tokenizer.json 이 필요한가요?

hyeogi

Owner Dec 28, 2023

안녕하세요. tokenizer 와 관련된 파일로 학습에 필요합니다.

owmawinchester

Dec 28, 2023

This comment has been hidden

3838seungsheon

Jan 2

답변 감사합니다. 혹시 llama를 이용해서 text summarization을 진행해본 경험이 있으신가요? 있으시다면 절차에 대해 간략하게 설명해주시면 정말 감사하겠습니다.
제가 생각한건 pdf 파일을 OCR을 이용하여 TEXT로 변환 후 -> 섹션 나뉘어서 LLAMA 모델로 요약하려고 하는데 요약할 때 어떤 식으로 사용해야하는지 감이 좀 안 잡히네요.

hyeogi

Owner Jan 5

•

edited Jan 5

안녕하세요 요약에 대한 경험이 있진않아서 크게 도움이 되진 못할 것 같습니다.
제 생각엔 말씀하신 프로세스로 진행하셔도 무방할 것 같고, 라마 모델 외에도 Bart 모델도 충분한 성능이 나오는 것으로 알고 있어서 한번 고려해보시면 좋을 것 같습니다.

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment