. ├── 1_data_clean/ # 数据清洗和预处理 ├── 2_torchtune/ # 使用 TorchTune 进行微调 ├── 3_hf_transformers/ # 使用 Hugging Face Transformers 进行微调 └── 4_unsloth/ # 使用 Unsloth 进行微调
1-install.sh: 安装依赖环境2-clean.py: 文本清洗脚本,包括纠正拼写错误、移除HTML标签和URL等3-quality_control.py: 数据质量分析脚本,包括统计信息计算和可视化dataset.csv 和 dataset300.csv: 示例数据集pyproject.toml: 项目依赖配置文件1-torchtune-install.sh: 安装 TorchTune 工具2-torchtune-download.sh: 下载预训练模型3-torchtune-tune.sh: 执行微调过程custom_config.yaml: 微调配置文件,包含模型、数据集、训练参数等配置1-run.sh: 运行训练脚本train.py: 训练脚本,使用 GLUE/MRPC 数据集对 BERT 模型进行微调pyproject.toml: 项目依赖配置文件1-install-unsloth.sh: 安装 Unsloth 及相关依赖2-run-train.sh: 运行训练脚本3-install-vllm.sh: 安装 vLLM 推理引擎4-launch-vllm.sh: 启动 vLLM 服务5-validation.sh: 验证微调效果train.py: 训练脚本,使用 LoRA 技术对 Qwen2.5-0.5B 模型进行高效微调resume.jsonl: 简历问答数据集,用于微调