GPT Models
Generative power — ChatGPT-এর পেছনের technology।
BERT যেখানে বুঝতে পারে, GPT সেখানে লিখতে পারে। OpenAI এর GPT family (GPT-1 → GPT-4) সম্পূর্ণ revolution এনেছে — ChatGPT এর behind এ এই decoder-only transformer। শুধু 'next word predict' task এ massive data এ train করে, একটা model পারে translation, summarization, coding, reasoning — সব।
GPT (Generative Pre-trained Transformer) একটি decoder-only transformer যা causal language modeling এ train — input হিসেবে token sequence, output হিসেবে পরের token predict। Causal mask দিয়ে future token দেখা বন্ধ। Scale বাড়লে (parameters, data, compute) — emergent ability দেখা যায় (few-shot learning, chain-of-thought)।
ভাবুন একজন writer — সে এক শব্দ লেখে, তারপর সেটা সহ পুরো লেখা পড়ে পরের শব্দ ভাবে, এভাবে চলতে থাকে। GPT ও তাই — autoregressive generation। 'The capital of France is ___' দিলে probability distribution দেয়, সেখান থেকে sample বা greedy pick করে 'Paris', তারপর সেটা সহ আবার generate। Scale করলে এই simple objective থেকে reasoning emerge করে।
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("gpt2")
model = AutoModelForCausalLM.from_pretrained("gpt2")
model.eval()
prompt = "Natural language processing is"
inputs = tokenizer(prompt, return_tensors="pt")
with torch.no_grad():
output = model.generate(
**inputs,
max_new_tokens=40,
do_sample=True,
top_k=50,
top_p=0.95,
temperature=0.8,
pad_token_id=tokenizer.eos_token_id,
)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)AutoModelForCausalLM GPT-2 (decoder-only) load করে। model.generate() autoregressive generation handle করে — top_k 50টা most likely token থেকে, top_p 95% cumulative probability mass থেকে sample। temperature 0.8 দিয়ে randomness control (1.0 = neutral, <1 = focused, >1 = creative)।
একটা command-line tool যা user prompt নেয়, GPT-2 দিয়ে story generate করে (configurable length, temperature, top-p), এবং final output সুন্দর করে print করে। Multiple variation generate করার option রাখুন।