Spcomponentloader Load Script Examples

Data Mixture Inference: What do BPE Tokenizers Reveal about their Training Data?

This repository contains all code for reproducing experiments from the paper Data Mixture Inference: What do BPE Tokenizers Reveal about their Training Data? Given a BPE tokenizer, our attack infers ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Data Mixture Inference: What do BPE Tokenizers Reveal about their Training Data?

Trending now