Aayush's ML & AI Notes

❯

01 ML & AI Concepts

❯

LLMs & Generative AI

❯

02 LLMs & Generative AI Index

02 - LLMs & Generative AI Index

Jan 11, 20262 min read

LLMs & Generative AI

LLM Operations

Prompt Engineering

Prompt Engineering Fundamentals
Prompt Design Patterns
Prompt Optimization Techniques
Prompt Injection and Safety

Fine-Tuning Strategies

Fine-Tuning Overview
Full Fine Tuning
LoRA (Low-Rank Adaptation)
QLoRA (Quantized LoRA)
P-Tuning
Adapter Methods

Model Evaluation

LLM Evaluation Metrics
Perplexity
BLUE Score
ROGUE Scores
Human Evaluation

Context Management

Context Window Fundamentals
Token Optimization
Context Compression Techniques
Sliding Window Attention
Long-Context Models

Production LLM Systems

Model Serving & Inference

Model Serving Architecture
Inference Optimization
Batching Strategies
KV Cache Optimization
Speculative Decoding
Model Quantization for Inference

Caching & Cost Management

Semantic Caching
Response Caching Strategies
Cost Optimization Techniques
Request Deduplication
Token Budget Management

Safety & Alignment

LLM Safety Fundamentals
RLHF
Direct Preference Optimization
Red Teaming

RAG Systems

01 - RAG Index
Vector Databases for RAG
Embedding Models
Retrieval Strategies
Hybrid Search
Re-ranking
RAG Evaluation

Multi-Modal Systems

Multi-Modal Models Overview
Joint Embedding Spaces
Vision-Language Models
Text-to-Image Generation
Image-to-Text Generation
Audio Processing with LLMs

Agent Systems

LLM Agents Fundamentals
ReAct Pattern
Tool Use and Function Calling
Agent Orchestration
Multi-Agent Systems
Agent Memory Systems

Generative Models

Transformer Language Models
GPT Architecture
BERT and Encoder Models
T5 and Encoder-Decoder Models
Diffusion Models
GANs (Generative Adversarial Networks)
VAEs (Variational Autoencoders)

Back to: ML & AI Index

Graph View

LLMs & Generative AI
LLM Operations
Prompt Engineering
Fine-Tuning Strategies
Model Evaluation
Context Management
Production LLM Systems
Model Serving & Inference
Caching & Cost Management
Safety & Alignment
RAG Systems
Multi-Modal Systems
Agent Systems
Generative Models

Backlinks

Context Compression Techniques
LLM Evaluation Metrics
LLM Safety Fundamentals
Prompt Injection and Safety
Token Optimization
ML & AI Index
Aayush's ML & AI Notes

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community