uutils
diff --git a/‎src/uu/numfmt/benches/numfmt_bench.rs‎
Lines changed: 27 additions & 32 deletions b/‎src/uu/numfmt/benches/numfmt_bench.rs‎
Lines changed: 27 additions & 32 deletions
diff --git a/‎src/uu/sort/benches/sort_bench.rs‎
Lines changed: 9 additions & 157 deletions b/‎src/uu/sort/benches/sort_bench.rs‎
Lines changed: 9 additions & 157 deletions
@@ -4,56 +4,45 @@
 // file that was distributed with this source code.
 
 use divan::{Bencher, black_box};
-use tempfile::TempDir;
 use uu_numfmt::uumain;
-use uucore::benchmark::{create_test_file, run_util_function};
-
-/// Generate numeric data for benchmarking
-fn generate_numbers(count: usize) -> String {
-    (1..=count)
-        .map(|n| n.to_string())
-        .collect::<Vec<_>>()
-        .join("\n")
-}
-
-/// Setup benchmark environment with test data
-fn setup_benchmark(data: String) -> (TempDir, String) {
-    let temp_dir = tempfile::tempdir().unwrap();
-    let file_path = create_test_file(data.as_bytes(), temp_dir.path());
-    let file_path_str = file_path.to_str().unwrap().to_string();
-    (temp_dir, file_path_str)
-}
+use uucore::benchmark::{run_util_function, setup_test_file, text_data};
 
 /// Benchmark SI formatting with different number counts
 #[divan::bench(args = [1_000_000])]
 fn numfmt_to_si(bencher: Bencher, count: usize) {
-    let (_temp_dir, file_path_str) = setup_benchmark(generate_numbers(count));
+    let data = text_data::generate_numbers(count);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
 
     bencher.bench(|| {
-        black_box(run_util_function(uumain, &["--to=si", &file_path_str]));
+        black_box(run_util_function(uumain, &["--to=si", file_path_str]));
     });
 }
 
 /// Benchmark SI formatting with precision format
 #[divan::bench(args = [1_000_000])]
 fn numfmt_to_si_precision(bencher: Bencher, count: usize) {
-    let (_temp_dir, file_path_str) = setup_benchmark(generate_numbers(count));
+    let data = text_data::generate_numbers(count);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
 
     bencher.bench(|| {
         black_box(run_util_function(
             uumain,
-            &["--to=si", "--format=%.6f", &file_path_str],
+            &["--to=si", "--format=%.6f", file_path_str],
         ));
     });
 }
 
 /// Benchmark IEC (binary) formatting
 #[divan::bench(args = [1_000_000])]
 fn numfmt_to_iec(bencher: Bencher, count: usize) {
-    let (_temp_dir, file_path_str) = setup_benchmark(generate_numbers(count));
+    let data = text_data::generate_numbers(count);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
 
     bencher.bench(|| {
-        black_box(run_util_function(uumain, &["--to=iec", &file_path_str]));
+        black_box(run_util_function(uumain, &["--to=iec", file_path_str]));
     });
 }
 
@@ -65,10 +54,11 @@ fn numfmt_from_si(bencher: Bencher, count: usize) {
         .map(|n| format!("{:.1}K", n as f64 / 1000.0))
         .collect::<Vec<_>>()
         .join("\n");
-    let (_temp_dir, file_path_str) = setup_benchmark(data);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
 
     bencher.bench(|| {
-        black_box(run_util_function(uumain, &["--from=si", &file_path_str]));
+        black_box(run_util_function(uumain, &["--from=si", file_path_str]));
     });
 }
 
@@ -80,37 +70,42 @@ fn numfmt_large_numbers_si(bencher: Bencher, count: usize) {
         .map(|n| (n * 1_000_000).to_string())
         .collect::<Vec<_>>()
         .join("\n");
-    let (_temp_dir, file_path_str) = setup_benchmark(data);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
 
     bencher.bench(|| {
-        black_box(run_util_function(uumain, &["--to=si", &file_path_str]));
+        black_box(run_util_function(uumain, &["--to=si", file_path_str]));
     });
 }
 
 /// Benchmark different padding widths
 #[divan::bench(args = [(1_000_000, 5), (1_000_000, 50)])]
 fn numfmt_padding(bencher: Bencher, (count, padding): (usize, usize)) {
-    let (_temp_dir, file_path_str) = setup_benchmark(generate_numbers(count));
+    let data = text_data::generate_numbers(count);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
     let padding_arg = format!("--padding={padding}");
 
     bencher.bench(|| {
         black_box(run_util_function(
             uumain,
-            &["--to=si", &padding_arg, &file_path_str],
+            &["--to=si", &padding_arg, file_path_str],
         ));
     });
 }
 
 /// Benchmark round modes with SI formatting
 #[divan::bench(args = [("up", 100_000), ("down", 1_000_000), ("towards-zero", 1_000_000)])]
 fn numfmt_round_modes(bencher: Bencher, (round_mode, count): (&str, usize)) {
-    let (_temp_dir, file_path_str) = setup_benchmark(generate_numbers(count));
+    let data = text_data::generate_numbers(count);
+    let file_path = setup_test_file(data.as_bytes());
+    let file_path_str = file_path.to_str().unwrap();
     let round_arg = format!("--round={round_mode}");
 
     bencher.bench(|| {
         black_box(run_util_function(
             uumain,
-            &["--to=si", &round_arg, &file_path_str],
+            &["--to=si", &round_arg, file_path_str],
         ));
     });
 }
 
@@ -4,161 +4,13 @@
 // file that was distributed with this source code.
 
 use divan::{Bencher, black_box};
-use std::path::PathBuf;
 use uu_sort::uumain;
-use uucore::benchmark::{create_test_file, run_util_function};
-
-/// Helper function to generate test data from a list of words
-fn generate_data_from_words(words: &[&str], num_lines: usize) -> Vec<u8> {
-    let mut data = Vec::new();
-    for i in 0..num_lines {
-        let word = words[i % words.len()];
-        let number = i % 1000;
-        data.extend_from_slice(format!("{word}_{number:03}\n").as_bytes());
-    }
-    data
-}
-
-/// Helper function to generate test data from a list of words without number suffix
-fn generate_data_from_words_simple(words: &[&str], num_lines: usize) -> Vec<u8> {
-    let mut data = Vec::new();
-    for i in 0..num_lines {
-        let word = words[i % words.len()];
-        data.extend_from_slice(format!("{word}\n").as_bytes());
-    }
-    data
-}
-
-/// Generate test data with ASCII-only text
-fn generate_ascii_data(num_lines: usize) -> Vec<u8> {
-    let words = [
-        "apple",
-        "banana",
-        "cherry",
-        "date",
-        "elderberry",
-        "fig",
-        "grape",
-        "honeydew",
-        "kiwi",
-        "lemon",
-        "mango",
-        "nectarine",
-        "orange",
-        "papaya",
-        "quince",
-        "raspberry",
-        "strawberry",
-        "tangerine",
-        "ugli",
-        "vanilla",
-        "watermelon",
-        "xigua",
-        "yellow",
-        "zucchini",
-        "avocado",
-    ];
-
-    generate_data_from_words(&words, num_lines)
-}
-
-/// Generate test data with accented characters that require locale-aware sorting
-fn generate_accented_data(num_lines: usize) -> Vec<u8> {
-    let words = [
-        // French words with accents
-        "café",
-        "naïve",
-        "résumé",
-        "fiancé",
-        "crème",
-        "déjà",
-        "façade",
-        "château",
-        "élève",
-        "côte",
-        // German words with umlauts
-        "über",
-        "Müller",
-        "schön",
-        "Köln",
-        "Düsseldorf",
-        "Österreich",
-        "Zürich",
-        "Mädchen",
-        "Bär",
-        "größer",
-        // Spanish words with tildes and accents
-        "niño",
-        "señor",
-        "año",
-        "mañana",
-        "español",
-        "corazón",
-        "María",
-        "José",
-        "más",
-        "también",
-    ];
-
-    generate_data_from_words(&words, num_lines)
-}
-
-/// Generate test data with mixed ASCII and non-ASCII characters
-fn generate_mixed_data(num_lines: usize) -> Vec<u8> {
-    let words = [
-        // Mix of ASCII and accented words
-        "apple",
-        "café",
-        "banana",
-        "naïve",
-        "cherry",
-        "résumé",
-        "date",
-        "fiancé",
-        "elderberry",
-        "crème",
-        "über",
-        "grape",
-        "Müller",
-        "honeydew",
-        "schön",
-        "niño",
-        "kiwi",
-        "señor",
-        "lemon",
-        "año",
-        "mango",
-        "María",
-        "orange",
-        "José",
-        "papaya",
-    ];
-
-    generate_data_from_words(&words, num_lines)
-}
-
-/// Generate test data with uppercase/lowercase variations
-fn generate_case_sensitive_data(num_lines: usize) -> Vec<u8> {
-    let base_words = [
-        "apple", "Apple", "APPLE", "banana", "Banana", "BANANA", "café", "Café", "CAFÉ", "über",
-        "Über", "ÜBER",
-    ];
-
-    generate_data_from_words_simple(&base_words, num_lines)
-}
-
-fn setup_test_file(data: &[u8]) -> PathBuf {
-    let temp_dir = tempfile::tempdir().unwrap();
-    let file_path = create_test_file(data, temp_dir.path());
-    // Keep temp_dir alive by leaking it - the OS will clean it up
-    std::mem::forget(temp_dir);
-    file_path
-}
+use uucore::benchmark::{run_util_function, setup_test_file, text_data};
 
 /// Benchmark sorting ASCII-only data
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_ascii_only(bencher: Bencher, num_lines: usize) {
-    let data = generate_ascii_data(num_lines);
+    let data = text_data::generate_ascii_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -169,7 +21,7 @@ fn sort_ascii_only(bencher: Bencher, num_lines: usize) {
 /// Benchmark sorting accented/non-ASCII data
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_accented_data(bencher: Bencher, num_lines: usize) {
-    let data = generate_accented_data(num_lines);
+    let data = text_data::generate_accented_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -180,7 +32,7 @@ fn sort_accented_data(bencher: Bencher, num_lines: usize) {
 /// Benchmark sorting mixed ASCII/non-ASCII data
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_mixed_data(bencher: Bencher, num_lines: usize) {
-    let data = generate_mixed_data(num_lines);
+    let data = text_data::generate_mixed_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -191,7 +43,7 @@ fn sort_mixed_data(bencher: Bencher, num_lines: usize) {
 /// Benchmark case-sensitive sorting with mixed case data
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_case_sensitive(bencher: Bencher, num_lines: usize) {
-    let data = generate_case_sensitive_data(num_lines);
+    let data = text_data::generate_case_sensitive_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -202,7 +54,7 @@ fn sort_case_sensitive(bencher: Bencher, num_lines: usize) {
 /// Benchmark case-insensitive sorting (fold case)
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_case_insensitive(bencher: Bencher, num_lines: usize) {
-    let data = generate_case_sensitive_data(num_lines);
+    let data = text_data::generate_case_sensitive_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -216,7 +68,7 @@ fn sort_case_insensitive(bencher: Bencher, num_lines: usize) {
 /// Benchmark dictionary order sorting (only blanks and alphanumeric)
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_dictionary_order(bencher: Bencher, num_lines: usize) {
-    let data = generate_mixed_data(num_lines);
+    let data = text_data::generate_mixed_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -251,7 +103,7 @@ fn sort_numeric(bencher: Bencher, num_lines: usize) {
 /// Benchmark reverse sorting with locale-aware data
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_reverse_locale(bencher: Bencher, num_lines: usize) {
-    let data = generate_accented_data(num_lines);
+    let data = text_data::generate_accented_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {
@@ -290,7 +142,7 @@ fn sort_key_field(bencher: Bencher, num_lines: usize) {
 /// Benchmark unique sorting with locale-aware data
 #[divan::bench(args = [100_000, 500_000])]
 fn sort_unique_locale(bencher: Bencher, num_lines: usize) {
-    let data = generate_accented_data(num_lines);
+    let data = text_data::generate_accented_data(num_lines);
     let file_path = setup_test_file(&data);
 
     bencher.bench(|| {