BART Large CNN — ONNX

ONNX export of BART Large CNN (406M parameters) with encoder-decoder architecture and KV cache support.

Fine-tuned for text summarization on the CNN/DailyMail dataset.

Converted for use with inference4j, an inference-only AI library for Java.

Original Source

try (var summarizer = BartSummarizer.bartLargeCnn().build()) {
    System.out.println(summarizer.summarize("Long article text..."));
}

Property	Value
Architecture	BART encoder-decoder (406M parameters, 12 encoder + 12 decoder layers)
Task	Text summarization
Training data	CNN/DailyMail
Tokenizer	BPE (50,265 tokens)
Original framework	PyTorch (transformers)
Export method	Hugging Face Optimum (encoder-decoder with KV cache)

This model is licensed under the Apache License 2.0. Original model by Facebook AI.