code_verify

A Python library for evaluating the similarity between code implementations. Provides multiple approaches to comparing code for different use cases.

Installation

# Install directly from GitHub
pip install git+https://github.com/andthattoo/code_verify.git

# Or clone and install locally
git clone https://github.com/andthattoo/code_verify.git
cd code_verify
pip install -e .

Features

Text-based similarity

Uses difflib to calculate edit distance between code snippets. This approach is fast and straightforward but sensitive to formatting, variable names, and implementation details.

from code_verify import calculate_code_similarity

similarity, metadata = calculate_code_similarity(
    ground_truth_code, 
    predicted_code, 
    use_ast=False
)

print(f"Similarity: {similarity}")

AST-based similarity

Compares the Abstract Syntax Tree structure of code, making it resilient to differences in variable names, formatting, and certain implementation variations.

from code_verify import calculate_code_similarity

similarity, metadata = calculate_code_similarity(
    ground_truth_code,
    predicted_code,
    use_ast=True
)

print(f"AST similarity: {metadata['ast_similarity']}")

Execution-based similarity

Evaluates code by executing it with test cases and comparing outputs, identifying functional equivalence regardless of implementation.

from code_verify import calculate_execution_similarity, generate_test_cases

# Generate test cases automatically based on function signature
test_cases = generate_test_cases("factorial", ["n"], count=5)

# Compare execution results
similarity, metadata = calculate_execution_similarity(
    ground_truth_code,
    predicted_code,
    test_cases=test_cases
)

print(f"Execution similarity: {similarity}")

Patch-based similarity

For comparing code changes (patches) rather than complete implementations:

from code_verify import calculate_change_similarity

similarity, metadata = calculate_change_similarity(
    code_context,           # Original files
    oracle_new_content,     # Expected content after changes
    predicted_new_content   # Actual content after changes
)

Safety

Execution-based similarity includes protections:

Sandbox environment that blocks dangerous operations
Execution timeouts
Multiple execution attempts for stability

Examples

The package includes comprehensive examples demonstrating each approach:

from code_verify.examples import (
    example_basic_usage,
    example_multiple_changes,
    example_flexible_tags,
    example_code_similarity,
    example_ast_similarity,
    example_change_similarity,
    example_execution_similarity
)

# Run all examples
example_execution_similarity()

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
code_verify		code_verify
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
run_examples.py		run_examples.py
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

code_verify

Installation

Features

Text-based similarity

AST-based similarity

Execution-based similarity

Patch-based similarity

Safety

Examples

License

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

andthattoo/code_verify

Folders and files

Latest commit

History

Repository files navigation

code_verify

Installation

Features

Text-based similarity

AST-based similarity

Execution-based similarity

Patch-based similarity

Safety

Examples

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages