跳转至

单卡训练

🚀 本页给出 OpenArmX 数据集在单卡 GPU 下的训练命令模板。

0. 通用前置

lerobot-env
export HF_HUB_OFFLINE=1
export TRANSFORMERS_OFFLINE=1

1. ACT

lerobot-train \
  --dataset.repo_id=local/你的数据名称 \
  --dataset.root=你的数据绝对路径 \
  --policy.type=act \
  --policy.push_to_hub=false \
  --output_dir=outputs/训练好的模型名字 \
  --batch_size=每个训练步的批次大小 \
  --steps=总训练步数 \
  --log_freq=每隔多少步输出一次日志 \
  --save_freq=每隔多少步保存一次

2. SmolVLA

lerobot-train \
  --dataset.repo_id=local/你的数据名称 \
  --dataset.root=你的数据绝对路径 \
  --dataset.video_backend=pyav \
  --policy.type=smolvla \
  --policy.path=lerobot/smolvla_base \
  --batch_size=每个训练步的批次大小 \
  --steps=总训练步数 \
  --output_dir=outputs/训练好的模型名字 \
  --wandb.enable=false \
  --log_freq=每隔多少步输出一次日志 \
  --save_freq=每隔多少步保存一次

3. Pi0

lerobot-train \
  --dataset.repo_id=local/你的数据名称 \
  --dataset.root=你的数据绝对路径 \
  --dataset.video_backend=pyav \
  --policy.type=pi0 \
  --policy.pretrained_path=lerobot/pi0_base \
  --policy.dtype=bfloat16 \
  --policy.gradient_checkpointing=false \
  --batch_size=每个训练步的批次大小 \
  --steps=总训练步数 \
  --output_dir=outputs/训练好的模型名字 \
  --wandb.enable=false \
  --log_freq=每隔多少步输出一次日志 \
  --save_freq=每隔多少步保存一次

4. Pi0.5

lerobot-train \
  --dataset.repo_id=local/你的数据名称 \
  --dataset.root=你的数据绝对路径 \
  --dataset.video_backend=pyav \
  --policy.type=pi05 \
  --policy.pretrained_path=lerobot/pi05_base \
  --policy.dtype=bfloat16 \
  --policy.gradient_checkpointing=true \
  --policy.compile_model=true \
  --policy.freeze_vision_encoder=false \
  --policy.train_expert_only=false \
  --policy.device=cuda \
  --batch_size=每个训练步的批次大小 \
  --steps=总训练步数 \
  --output_dir=outputs/训练好的模型名字 \
  --wandb.enable=false \
  --log_freq=每隔多少步输出一次日志 \
  --save_freq=每隔多少步保存一次

5. XVLA

lerobot-train \
  --dataset.repo_id=local/你的数据名称 \
  --dataset.root=你的数据绝对路径 \
  --dataset.video_backend=pyav \
  --job_name=xvla_openarmx \
  --policy.path=lerobot/xvla-base \
  --policy.dtype=bfloat16 \
  --policy.action_mode=auto \
  --policy.device=cuda \
  --policy.freeze_vision_encoder=false \
  --policy.freeze_language_encoder=false \
  --policy.train_policy_transformer=true \
  --policy.train_soft_prompts=true \
  --policy.push_to_hub=false \
  --policy.empty_cameras=0 \
  --policy.num_image_views=3 \
  --rename_map='{"observation.images.cam_head": "observation.images.image", "observation.images.cam_right": "observation.images.image2", "observation.images.cam_left": "observation.images.image3"}' \
  --batch_size=每个训练步的批次大小 \
  --steps=总训练步数 \
  --output_dir=outputs/训练好的模型名字 \
  --wandb.enable=false \
  --log_freq=每隔多少步输出一次日志 \
  --save_freq=每隔多少步保存一次

📌 训练参数速查

  • --batch_size:显存优先参数,先调它
  • --steps:总训练步数
  • --log_freq:日志间隔
  • --save_freq:模型保存间隔
  • --resume=true:断点续训

🧠 实操建议

  • 新任务先用小步数冒烟训练(如 1k~5k steps)
  • loss 稳定下降后再扩大步数和 batch
  • 所有路径尽量使用绝对路径,避免终端切换造成路径错误