vLLM 加载和部署 LoRA 微调后的模型

vLLM 完全支持加载和部署 LoRA 微调后的模型,并且能带来显著的性能提升。 两种部署方式 方式一:直接…

  • AI算法
  • 2025/10/27
  • 4
  • 使用微调后的大模型

    使用微调后的大模型 from fastapi import FastAPI, HTTPException, Depends from pydantic import Ba…

  • AI算法
  • 2025/10/26
  • 4
  • 使用LoRA进行大模型数据微调三

    大模型微调的数据格式,核心可以归结为两种主流范式:一种是基于“对话结构”的 ShareGPT格式,另一种是…

  • AI算法
  • 2025/10/25
  • 2
  • 使用LoRA进行大模型数据微调二

    gpu版 import os import torch from datasets import load_dataset from transformers import ( …

  • AI算法
  • 2025/10/24
  • 3