KOREAson/YiSang-HighQuality
Viewer • Updated • 284k • 863 • 6
How to use lee-monster/ZT0_v1 with PEFT:
from peft import PeftModel
from transformers import AutoModelForCausalLM
base_model = AutoModelForCausalLM.from_pretrained("unsloth/gpt-oss-20b-unsloth-bnb-4bit")
model = PeftModel.from_pretrained(base_model, "lee-monster/ZT0_v1")How to use lee-monster/ZT0_v1 with Unsloth Studio:
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for lee-monster/ZT0_v1 to start chatting
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for lee-monster/ZT0_v1 to start chatting
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for lee-monster/ZT0_v1 to start chatting
pip install unsloth
from unsloth import FastModel
model, tokenizer = FastModel.from_pretrained(
model_name="lee-monster/ZT0_v1",
max_seq_length=2048,
)ZTO_v1은 unsloth/gpt-oss-20b를 기반으로 데이터 분석 및 MLOps 태스크에 특화되도록 파인튜닝된 한국어 모델입니다. LoRA(Low-Rank Adaptation) 기술을 사용하여 효율적으로 학습되었으며, 시니어 데이터 분석가 및 MLOps 컨설턴트 역할을 수행할 수 있습니다.
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
import torch
# 베이스 모델 로드
base_model = AutoModelForCausalLM.from_pretrained(
"unsloth/gpt-oss-20b",
torch_dtype=torch.float16,
device_map="auto",
trust_remote_code=True
)
# LoRA 어댑터 로드
model = PeftModel.from_pretrained(base_model, "lee-monster/ZT0_v1")
# 토크나이저 로드
tokenizer = AutoTokenizer.from_pretrained("lee-monster/ZT0_v1")
messages = [
{"role": "system", "content": "당신은 시니어 데이터 분석가이자 MLOps 컨설턴트입니다."},
{"role": "user", "content": "리뷰데이터를 활용한 텍스트 분석을 통한 경쟁사 대비 차별성을 도출하려면 어떻게 분석해야해?"}
]
inputs = tokenizer.apply_chat_template(
messages,
add_generation_prompt=True,
return_tensors="pt",
return_dict=True
).to(model.device)
with torch.no_grad():
outputs = model.generate(
**inputs,
max_new_tokens=512,
do_sample=True,
temperature=0.7,
top_p=0.9,
pad_token_id=tokenizer.eos_token_id
)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)
이 모델은 다음 분야에서 우수한 성능을 보입니다:
이 모델은 CC-BY-4.0 라이선스로 배포됩니다.