HuggingFace Transformers
NLP-এর সবচেয়ে important library।
একটা library — যেখান থেকে আপনি BERT, GPT-2, T5, LLaMA, Whisper — শতশত pretrained model মাত্র দুই লাইনে download করে use করতে পারেন। নাম: HuggingFace Transformers — modern NLP এর de facto standard library।
HuggingFace Transformers হলো একটি Python library যা PyTorch, TensorFlow, JAX — সব framework এ pretrained transformer model এর unified API দেয়। তিনটা core abstraction: AutoTokenizer (text → token), AutoModel (architecture), pipeline() (end-to-end task ready)। Hub এ ১ লক্ষ+ model, dataset, demo।
ভাবুন App Store — যেখানে শত শত ready-made app আছে, install করলেই use। HuggingFace Hub সেটাই NLP model এর জন্য। আপনাকে architecture জানতে হবে না, weight download করতে হবে না, training লাগবে না — শুধু from_pretrained('model-name') লিখলেই production-ready model হাতে।
from transformers import pipeline
classifier = pipeline("sentiment-analysis")
ner = pipeline("ner", grouped_entities=True)
summarizer = pipeline("summarization", model="sshleifer/distilbart-cnn-12-6")
translator = pipeline("translation_en_to_fr", model="Helsinki-NLP/opus-mt-en-fr")
print(classifier("HuggingFace makes NLP so simple!"))
text = "Sundar Pichai, the CEO of Google, announced new AI features in Mountain View."
print(ner(text))
article = (
"Natural Language Processing has evolved dramatically over the past decade. "
"From rule based systems to deep learning and transformer architectures, "
"the field has been revolutionized. Today, large language models power "
"chatbots, translators, and writing assistants used by millions of people."
)
print(summarizer(article, max_length=40, min_length=15, do_sample=False))
print(translator("Hello, how are you?"))pipeline() তিনটা কাজ একসাথে করে: tokenize, model forward, post-process। Task name দিলে HuggingFace default model auto-pick করে। নিজে model parameter দিয়ে override ও করা যায়। grouped_entities=True NER এ multi-token entity merge করে।
একটা CLI tool যেখানে user choose করতে পারে: sentiment, NER, summarize, translate। প্রতিটার জন্য HuggingFace pipeline, input text accept করে output সুন্দর format এ print করে।