Large Language Models
LLM কি, কিভাবে কাজ করে, scaling laws।
GPT-3 — 175 billion parameter। GPT-4 — কেউ জানে না কত, কিন্তু trillion এর কাছাকাছি। LLaMA, Claude, Gemini — সব massive scale এর model। এই scale ই unlock করেছে এমন capability যা ছোট model দেখায়নি — reasoning, code, multi-step planning। Large Language Model — AI revolution এর backbone।
LLM হলো এমন transformer-based language model যার parameter count billions/trillions এ — massive corpus (trillion+ token) এ pretrain করা। Key concepts: Scaling laws (Kaplan/Chinchilla — parameter, data, compute এর সঠিক balance), Emergent ability (নির্দিষ্ট scale এর পর হঠাৎ নতুন skill), In-context learning (parameter update ছাড়াই few-shot example দিয়ে শেখা), Instruction tuning + RLHF (helpful + harmless বানানো)।
ভাবুন একটা ছাত্র — primary তে শুধু পড়তে পারে, high school এ essay লিখতে পারে, university তে research করে। Scale (knowledge + experience) বাড়ার সাথে capability emerge করে। LLM ও তেমন — 1B parameter এ basic language, 10B এ reasoning, 100B+ এ chain-of-thought, code, multi-language fluency। Phase transition এর মত — হঠাৎ নতুন capability।
import os
from openai import OpenAI
client = OpenAI(
base_url="https://ai.gateway.lovable.dev/v1",
api_key=os.environ["LOVABLE_API_KEY"],
)
messages = [
{"role": "system", "content": "You are a concise NLP tutor. Explain in 2 sentences."},
{"role": "user", "content": "What is the difference between BERT and GPT?"},
]
response = client.chat.completions.create(
model="google/gemini-2.5-flash",
messages=messages,
temperature=0.4,
max_tokens=200,
)
print(response.choices[0].message.content)
print(f"\nTokens used: {response.usage.total_tokens}")OpenAI-compatible client দিয়ে Lovable AI Gateway তে call। system message bot এর personality set করে, user message actual question। temperature 0.4 মানে balanced (creative না, deterministic ও না)। response এ message + token usage দুটোই।
একটা CLI tool যা model name, system prompt, temperature নেয় এবং user এর সাথে multi-turn conversation চালায়। Token usage, latency, cost estimate display করে।