One-Pass-to-Reason

Official code repository of One-Pass to Reason: Token Duplication and Block-Sparse Mask for Efficient Fine-Tuning on Multi-Turn Reasoning

One-Pass to Reason: Token Duplication and Block-Sparse Mask for Efficient Fine-Tuning on Multi-Turn Reasoning
Ritesh Goru, Shanay Mehta, Prateek Jain
Paper: https://arxiv.org/abs/2504.18246
Dataset: https://huggingface.co/datasets/devrev-research/MathChatSync-reasoning

Setup instructions

Run bash setup.sh.

The script will:

Clone the appropriate version of LLamaFactory
Apply our modifications

Use the special_mask_for_reasoning flag to train your models in a single pass!

Citation:

@article{goru2025efficientsinglepasstrainingmultiturn,
    title={Efficient Single-Pass Training for Multi-Turn Reasoning},
    author={Ritesh Goru and Shanay Mehta and Prateek Jain},
    year={2025},
    eprint={2504.18246},
    archivePrefix={arXiv},
    primaryClass={cs.CL},
    url={https://arxiv.org/abs/2504.18246},
}

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.devrev		.devrev
.github		.github
dataset		dataset
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
apply_patches.sh		apply_patches.sh
one-pass-to-reason.patch		one-pass-to-reason.patch
setup.sh		setup.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

One-Pass-to-Reason

Setup instructions

Citation:

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

devrev/One-Pass-to-Reason

Folders and files

Latest commit

History

Repository files navigation

One-Pass-to-Reason

Setup instructions

Citation:

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages