TokenFlow

TokenFlow is designed for reliable large-scale concurrent network requests, especially for tasks such as requesting large language models (LLMs) for data synthesis.

The design goal of TokenFlow is to implement a task framework for applications such as large-scale language model data synthesis in a sufficiently concise manner, while being flexible and incorporating robust error handling, statistical information, pause and checkpoint resumption, progress persistence, and other functionalities. The entire module of TokenFlow is contained within a single Python file, making it easy for users to integrate into their projects.

Features

High Performance

Generate 1 million token in seconds (demo: gpt-4o-mini):

tokenflow_demo.mp4

Usage Examples

Simple Task

from typing import Any
import asyncio
import logging

import openai
from tokenflow import TokenFlowTask, TokenFlowRequestTrajectory, ActionDone, ActionContinue, TokenFlowAction

logging.basicConfig(level=logging.DEBUG)

client = openai.AsyncOpenAI()

async def handler(request_trajectory: TokenFlowRequestTrajectory) -> tuple[TokenFlowAction, Any]:
    if request_trajectory.length() >= 3:
        print("Too much retry, stop")
        return ActionDone(), "Too much retry, stop", None
    
    params = request_trajectory.last().request_params
    
    try:
        response = await client.chat.completions.create(
            messages=[{"role": "user", "content": params}],
            model="gemini-2.0-flash",
            temperature=0.1,
            max_tokens=4,
        )

        result = response.choices[0].message.content

        return ActionDone(), result, None
    
    except Exception as e:
        return ActionContinue(params), str(e), None
    
async def main():
    params = [f"say {i}" for i in range(50)]

    tf_task = TokenFlowTask(
        request_fn=handler,
        request_params=params
    )

    tf_task.run(n_workers=4)

    result = await tf_task.wait_for_done()

    str_result = [r.request_trajectory.last().result for r in result]
    print(str_result)

    print("All done")

if __name__ == "__main__":
    asyncio.run(main())

Pause and Resume

from typing import Any
import asyncio
import logging

import openai
from tokenflow import TokenFlowTask, TokenFlowRequestTrajectory, ActionDone, ActionContinue, TokenFlowAction

logging.basicConfig(level=logging.DEBUG)

client = openai.AsyncOpenAI()

async def handler(request_trajectory: TokenFlowRequestTrajectory) -> tuple[TokenFlowAction, Any]:
    if request_trajectory.length() >= 3:
        print("Too much retry, stop")
        return ActionDone(), "Too much retry, stop", None
    
    params = request_trajectory.last().request_params
    
    try:
        response = await client.chat.completions.create(
            messages=[{"role": "user", "content": params}],
            model="gemini-2.0-flash",
            temperature=0.1,
            max_tokens=4,
        )

        result = response.choices[0].message.content

        return ActionDone(), result, None
    
    except Exception as e:
        return ActionContinue(params), str(e), None
    
async def main():
    params = [f"say {i}" for i in range(50)]

    tf_task = TokenFlowTask(
        request_fn=handler,
        request_params=params
    )

    tf_task.run(n_workers=2)

    await asyncio.sleep(5)

    print("Pause task")
    await tf_task.soft_stop() # or await tf_task.hard_stop() to immediately stop the task
    print("Press enter to continue...")
    input()
    print("Resume task")
    tf_task.run(n_workers=2)

    result = await tf_task.wait_for_done()

    str_result = [r.request_trajectory.last().result for r in result]
    print(str_result)

    print("All done")

if __name__ == "__main__":
    asyncio.run(main())

Progress Bar

You need have tqdm installed first.

import logging
import asyncio
from typing import Any
import openai
from tokenflow import TokenFlowTask, TokenFlowRequestTrajectory, ActionDone, ActionContinue, TokenFlowAction, TokenFlowEvent, TokenFlowDoneEvent, TokenFlowContinueEvent
from tqdm import tqdm

client = openai.AsyncOpenAI()

async def handler(request_trajectory: TokenFlowRequestTrajectory) -> tuple[TokenFlowAction, Any]:
    if request_trajectory.length() >= 3:
        print("Too much retry, stop")
        return ActionDone(), "Too much retry, stop", None
    
    params = request_trajectory.last().request_params
    
    try:
        response = await client.chat.completions.create(
            messages=[{"role": "user", "content": params}],
            model="gemini-2.0-flash",
            temperature=0.1,
            max_tokens=4,
        )

        result = response.choices[0].message.content

        return ActionDone(), result, None
    
    except Exception as e:
        return ActionContinue(params), str(e), None
    
async def main():
    params = [f"say {i}" for i in range(50)]

    pbar = tqdm(total=len(params), desc="Processing", unit="request")

    def event_callback(event: TokenFlowEvent) -> None:
        match event:
            case TokenFlowDoneEvent():
                pbar.update(1)
            case TokenFlowContinueEvent():
                print(f"Continue: {event.request_trajectory.last().request_params}")

    tf_task = TokenFlowTask(
        request_fn=handler,
        request_params=params,
        event_callback=event_callback,
    )

    tf_task.run(n_workers=2)

    result = await tf_task.wait_for_done()

    str_result = [r.request_trajectory.last().result for r in result]
    print(str_result)

    print("All done")

if __name__ == "__main__":
    asyncio.run(main())

TODO

Statistics
Re-considered event system, maybe async callback, and create_task(callback()) to avoid blocking.
Progress persistence (eg. save to file)

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
LICENSE		LICENSE
README.md		README.md
tokenflow.py		tokenflow.py
tokenflow_demo.mp4		tokenflow_demo.mp4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TokenFlow

Features

High Performance

Usage Examples

Simple Task

Pause and Resume

Progress Bar

TODO

About

Releases

Packages

Languages

License

neteroster/tokenflow

Folders and files

Latest commit

History

Repository files navigation

TokenFlow

Features

High Performance

Usage Examples

Simple Task

Pause and Resume

Progress Bar

TODO

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages