Yapay Zeka ve Teknoloji Sözlüğü
LLM, agent, MCP, RAG, embedding, fine-tuning, kuantizasyon — yapay zeka ve teknoloji terimlerinin Türkçe açıklamalı sözlüğü. Toplam 49 terim.
A
- Agent (Yapay Zeka Ajanı)
- Hedef tanımına göre kendi başına plan yapan, araç çağıran ve sonuç değerlendirebilen LLM tabanlı sistem.
- Klasik sohbet botundan farklı: kullanıcı bir hedef verir, agent kendi başına alt-görevleri sıralar, dosya/araç çağırır, çıktıyı kontrol eder, gerekirse plan günceller. Claude Code, Codex, Cursor Composer örnekleridir.
- API (Application Programming Interface)
- Bir yazılımın diğer yazılımlarla konuşmasını sağlayan programlama arayüzü.
- LLM bağlamında: model sağlayıcısının (OpenAI, Anthropic, Google) sunduğu HTTP endpoint'leri. Token kotalı, kart bağlamayla başlatılır.
B
- Bağlam Penceresi (Context Window)
- Bir LLM'in tek seferde okuyabileceği maksimum token sayısı.
- 2026'da Claude 1M, Gemini 2M, GPT-5 256K seviyesinde. Bağlam tükendiğinde model bilgi kaybeder. RAG bunu aşmak için kullanılır.
- Batch API
- Yüksek hacimli istekleri %50 indirimli ama 24 saatlik gecikme ile işleyen API modu.
- Anthropic, OpenAI, Google sunar. İçerik üretimi, veri zenginleştirme, sınıflandırma gibi acil olmayan görevlerde maliyet düşürür.
- BERT
- Google'ın 2018'de yayınladığı çift yönlü transformer modeli.
- Modern LLM'lerin atası. Türkçe için BERTurk (dbmdz/bert-base-turkish-cased) klasik fine-tuning hâlâ yaygın kullanılır — sınıflandırma, NER (varlık tanıma) gibi görevler için.
C
- Chain of Thought (Düşünce Zinciri, CoT)
- Modelden adım adım akıl yürütmesini isteme tekniği.
- Karmaşık matematik, mantık problemlerinde doğruluğu artırır. O3, o4, DeepSeek-R1 gibi 'akıl yürütme modelleri' bunu otomatik yapar.
- ChatML
- OpenAI'ın çoklu-tur sohbet formatı: role + content yapısı.
- system / user / assistant / tool rolleri ile mesaj dizisi. Hugging Face'de fine-tune dataset'leri tipik olarak ChatML formatında.
- Claude
- Anthropic'in büyük dil modeli ailesi (Opus, Sonnet, Haiku).
- Constitutional AI yaklaşımıyla eğitilir. 2026'da pazarın üç büyük modeli arasında. Yazılım, uzun-belge analizi, yaratıcı yazım liderlerinden.
- Constitutional AI
- Modelin kendi yanıtlarını bir 'anayasa' (etik ilkeler listesi) referans alarak kritik ettiği eğitim yöntemi.
- Anthropic'in özgün yaklaşımı. İnsan etiketleyici sayısı azaltılır, model kendini hizalar.
- Cost per Million Tokens
- LLM API fiyatlandırması — milyon giriş veya çıkış token'ı başına dolar.
- 2026'da: Claude Opus $15/M giriş, $75/M çıkış. Sonnet $3/$15. Haiku $0.80/$4. DeepSeek $0.27/$1.10. Hibrit kullanım yaygın.
D
- DeepSeek
- Çinli AI laboratuvarının fiyat-performans odaklı LLM ailesi.
- DeepSeek-V3 ana model, R1 akıl yürütme uzmanı, Coder kod özel. Premium modellerin 1/10-1/30'u maliyetle.
- Distillation (Damıtma)
- Büyük bir modelin (öğretmen) bilgisini küçük bir modele (öğrenci) aktarma yöntemi.
- Sonuç: küçük model, büyük modelin yeteneklerine yaklaşır ama 5-10 kat hızlı/ucuz. DeepSeek-R1-Distill-Llama-70B örnek.
E
- Embedding (Gömleme)
- Bir metni sabit-boyutlu sayı vektörüne dönüştüren temsil.
- Genelde 768-3072 boyut. Anlamca yakın metinlerin vektörleri yakındır. RAG, arama, sınıflandırma için temel.
F
- Fine-Tuning (İnce Ayar)
- Önceden eğitilmiş bir modeli kendi verinizle özel görev/alana uyarlama.
- LoRA, QLoRA, full FT yöntemleri var. Stil/format/davranış değiştirmek için iyi; bilgi eklemek için RAG tercih edilir.
- FLUX (Black Forest Labs)
- 2024-2026'nın en güçlü açık ağırlıklı görüntü üretim modeli.
- FLUX.1-dev, FLUX.1-schnell, FLUX.1-pro varyantları. Stable Diffusion'ın ardılı; tipografi ve elliyle görüntü üretiminde sektör standardı.
- Function Calling / Tool Use
- LLM'in dış sistemleri çağırmak için yapılandırılmış parametreler üretmesi.
- Modele 'Şu fonksiyonlar var: list_emails, send_message' dersiniz; model uygun fonksiyonu uygun parametrelerle çağırır. Agent davranışının temeli.
G
- Gemini
- Google'ın çok-modal büyük dil modeli ailesi.
- Pro, Flash, Nano, Ultra varyantları. 2M token bağlam, görüntü+ses+video. NotebookLM, Code Assist, Vertex AI ürünlerinde.
- GPT (Generative Pretrained Transformer)
- OpenAI'ın temel mimarisi; aynı zamanda ana model isimlerinin başı (GPT-4, GPT-5).
- 2026'da GPT-5 ana akış, o-serisi (o3, o4) akıl yürütme uzmanları. ChatGPT ürününün altında çalışır.
H
- Halüsinasyon (Hallucination)
- LLM'in gerçeğe uymayan bir bilgiyi güvenle üretmesi.
- RAG, function calling, kaynak gösterme ile büyük ölçüde azaltılır. O-serisi gibi akıl yürütme modelleri en düşük halüsinasyon oranlarına sahip.
- Hugging Face
- Açık ağırlıklı modellerin GitHub'ı sayılan platform.
- 1.5M+ model, 250K+ dataset, Spaces (demo), Inference Endpoints, Transformers/Diffusers/PEFT kütüphaneleri.
J
- JSON Mode / Structured Output
- LLM'in geçerli bir JSON şemasına uygun çıktı üretmesini garanti eden mod.
- OpenAI ve Anthropic 'structured output' özelliği token üretimini şemaya zorlar; hatasız JSON döner. Function calling alternatifi.
K
- KVKK
- Kişisel Verilerin Korunması Kanunu (6698 sayılı, Türkiye).
- LLM'lere kişisel veri gönderirken aydınlatma+rıza, yurt dışı aktarım kuralları geçerli. Yerel açık model kullanımı en güvenli yol.
L
- LangChain
- LLM uygulamalarını kolaylaştıran orchestration framework.
- LCEL (LangChain Expression Language), LangGraph (graf-tabanlı agent), LangSmith (trace) alt projelerle. Python ve JS sürümleri.
- Llama
- Meta'nın açık ağırlıklı LLM ailesi.
- Llama 3, 4 (Scout/Maverick/Behemoth), 3.3 sürümleri. 700M aylık aktif kullanıcı eşiği üstü ek izin gerektirir.
- LlamaIndex
- RAG ve veri-yoğun LLM uygulamalarına odaklanmış framework.
- 200+ veri yükleyici, kıdemli RAG soyutlamaları. LangChain'den daha 'RAG-first' tasarım.
- LLM (Large Language Model, Büyük Dil Modeli)
- Milyarlarca parametre içeren transformer tabanlı dil modeli.
- Token tahmini ile çalışır; eğitim verisi internet ölçeğinde. 2026'da en küçük yararlı modeller 7B, en büyükler 1T+ aktif parametre.
- LoRA (Low-Rank Adaptation)
- Modelin yanına küçük adapter matrisleri ekleyip sadece onları eğiten fine-tuning yöntemi.
- Donanım ihtiyacı 100x azalır, kalite çoğunlukla full FT ile başa baş. 2026'da fine-tuning'in standart yöntemi.
M
- MCP (Model Context Protocol)
- Anthropic'in açık standardı; LLM araçları ile dış sistemler arasındaki ortak protokol.
- GitHub, Slack, Postgres, Stripe gibi sistemler MCP sunucusu sunar; Claude Code, Cursor, Codex CLI tüm uyumlu istemciler aynı sunucuya bağlanır.
- Mistral
- Fransız AI laboratuvarının LLM ailesi.
- Mistral Large 2, Codestral, Mixtral (MoE). Apache 2.0 lisansla en serbest açık modeller arasında. AB veri merkezleri ile KVKK dostu.
- MoE (Mixture of Experts)
- Modelin sadece bir alt kümesinin (expert) her token için aktif edildiği mimari.
- Toplam parametre çok büyük olabilir (DeepSeek-V3 671B), aktif parametre düşük (37B). Sonuç: aynı donanımda daha güçlü model.
- Multimodal (Çok-Modal)
- Birden fazla veri türünü (metin, görüntü, ses, video) işleyen model.
- Gemini, GPT-5, Claude (görüntü+metin) çok-modal. Tek prompt'ta görüntü+metin+ses karışık bağlam.
O
- Ollama
- Açık ağırlıklı LLM'leri kendi makinenizde çalıştırmanın en kolay yolu.
- Llama, Qwen, DeepSeek, Mistral, Gemma destekli. OpenAI uyumlu API sunar. KVKK uyumlu yerel kurulum için ideal.
P
- Prompt
- Modeli yönlendiren talimat metni.
- System prompt (rol+kurallar), user prompt (görev), few-shot örnekleri tipik bileşenler. İyi prompt %30-50 doğruluk artırır.
- Prompt Cache
- Tekrarlayan sistem prompt + bağlam bloklarının önbelleğe alındığı API özelliği.
- Anthropic 5 dakika TTL ile cache, %90 indirim. Google ve OpenAI de benzer. Üretimde önemli optimizasyon.
- Prompt Injection
- Kullanıcı veya dış metin yoluyla LLM'in talimatlarını manipüle etme saldırısı.
- E-posta, web sayfası, doc içine gömülü 'şu eylemi yap' komutu modelin öncelikli talimatlarını delebilir. Hassas eylemlerde insan onayı zorunlu.
Q
- Quantization (Kuantizasyon)
- Model ağırlıklarını daha az bit ile temsil etme — boyut ve hız kazancı.
- FP16 → INT8 → INT4 zinciri. Q4_K_M dengeli; %1-3 kalite kaybı, 4 kat boyut azalması. Yerel çalıştırmanın anahtarı.
- Qwen
- Alibaba Cloud'un açık ağırlıklı LLM ailesi.
- Qwen3 0.5B-235B yelpazesi, Apache 2.0 lisans. Türkçe performansta sürpriz lider.
R
- RAG (Retrieval-Augmented Generation)
- Modele kendi belgelerinizi getirip cevap ürettirten mimari.
- Embedding + vector DB + LLM zinciri. Halüsinasyonu büyük ölçüde azaltır; cevabı kaynaklı yapar.
- Reranker
- Vector arama ile çekilen sonuçları yeniden sıralayan ikinci kademe model.
- Cohere, BGE, Jina rerankers. RAG doğruluğunu %15-30 artırır.
- RLHF (Reinforcement Learning from Human Feedback)
- İnsan tercihlerinden pekiştirmeli öğrenme — modeli insan beklentisine hizalama yöntemi.
- ChatGPT'yi 'sohbete uygun' yapan teknikti. 2024+ ile DPO, ORPO gibi alternatifler ön plana çıktı.
S
- Sora
- OpenAI'ın metin → video üretim modeli.
- ChatGPT Pro abonelik kapsamında. 60 saniyeye kadar yüksek kalite klipler. Türkçe komut destekli.
- Stable Diffusion
- Stability AI'ın açık ağırlıklı görüntü üretim modeli ailesi.
- SD 1.5, SDXL, SD3.5, FLUX (ardılı). LoRA, ControlNet, AUTOMATIC1111/ComfyUI ile özelleştirilir. Yerel ücretsiz.
- System Prompt
- Konuşmanın başında modele verilen rol, kural ve davranış talimatları.
- Tüm sohbet boyunca aktif kalır. 'Sen Türkçe asistansın, kullanıcıya siz diye hitap et' gibi.
T
- Token
- LLM'in metni işlediği temel birim — yaklaşık 1 kelime veya 4 karakter.
- Türkçe, İngilizce'den ortalama %40 daha fazla token harcar. Maliyet ve bağlam pencere ölçümü token üzerinden.
- Tool Use
- Bkz. Function Calling. LLM'in dış sistemleri çağırabilmesi.
- Anthropic 'tool use' terimini, OpenAI 'function calling' terimini tercih eder; aynı kavramın iki adı.
- Transformer
- 2017'de yayınlanan, modern LLM'lerin temel mimarisi.
- Attention mekanizması ile uzun bağlamı paralel işler. RNN'in ardılı.
V
- Vector DB (Vektör Veritabanı)
- Yüksek boyutlu vektörleri benzerlik araması için saklayan veritabanı.
- Pinecone, Qdrant, Weaviate, Chroma, Milvus, pgvector. RAG'ın altyapı bileşeni.
W
- Whisper
- OpenAI'ın açık ağırlıklı çok-dilli ses → yazı modeli.
- 99+ dil destekli, Türkçe doğruluğu yüksek. Yerel çalıştırılabilir; ücretsiz. API olarak da $0.006/dakika.
Z
- Zero-shot
- Modele örnek vermeden doğrudan iş yaptırma.
- Hızlı ama tutarsız olabilir. Tutarlılık için few-shot (örnek verme) tercih edilir.