Infinirc/Llama-3.2-Infinirc-3B-Instruct

模型詳情

開發者:陳昭儒Infinirc.com
模型版本:1.0
訓練數據:采用與台灣文化相關的資料集,包括、對話、台灣新聞、文學作品、網路文章、程式、醫療問題、英文對話等。

目的和用途

Llama-3.2-Infinirc-11B-Vision-Instruct模型是專門為了更好地理解和生成與台灣文化相關的文本而設計和微調的。目標是提供一個能夠捕捉台灣特有文化元素和語言習慣的強大語言模型,適用於文本生成、自動回答等多種應用。

模型架構

基礎模型:meta-llama/Llama-3.2-3B-Instruct

Evaluation

Tasks Version Filter n-shot Metric Value Stderr
arc_easy 1 none 0 acc 0.7273 ± 0.0091
none 0 acc_norm 0.6595 ± 0.0097
hellaswag 1 none 0 acc 0.5087 ± 0.0050
none 0 acc_norm 0.6963 ± 0.0046
piqa 1 none 0 acc 0.7432 ± 0.0102
none 0 acc_norm 0.7394 ± 0.0102
winogrande 1 none 0 acc 0.6496 ± 0.0134

使用和限制

請遵守許可證限制。

風險與倫理考量

使用本模型時應注意確保生成的內容不包含歧視性或有害信息。模型的開發和使用應遵循倫理準則和社會責任。

聯絡方式

如有任何問題或需要進一步的信息,請透過下方聯絡方式與我們團隊聯繫:
Email: [email protected]
網站: https://infinirc.com

Downloads last month
135
Safetensors
Model size
3.21B params
Tensor type
BF16
·
Inference Providers NEW
This model is not currently available via any of the supported third-party Inference Providers, and the model is not deployed on the HF Inference API.

Model tree for Infinirc/Llama-3.2-Infinirc-3B-Instruct

Quantizations
1 model

Collection including Infinirc/Llama-3.2-Infinirc-3B-Instruct