Yapay Zeka ve Teknoloji Sözlüğü

LLM, agent, MCP, RAG, embedding, fine-tuning, kuantizasyon — yapay zeka ve teknoloji terimlerinin Türkçe açıklamalı sözlüğü. Toplam 49 terim.

A

Agent (Yapay Zeka Ajanı): Hedef tanımına göre kendi başına plan yapan, araç çağıran ve sonuç değerlendirebilen LLM tabanlı sistem.; Klasik sohbet botundan farklı: kullanıcı bir hedef verir, agent kendi başına alt-görevleri sıralar, dosya/araç çağırır, çıktıyı kontrol eder, gerekirse plan günceller. Claude Code, Codex, Cursor Composer örnekleridir.
API (Application Programming Interface): Bir yazılımın diğer yazılımlarla konuşmasını sağlayan programlama arayüzü.; LLM bağlamında: model sağlayıcısının (OpenAI, Anthropic, Google) sunduğu HTTP endpoint'leri. Token kotalı, kart bağlamayla başlatılır.

B

Bağlam Penceresi (Context Window): Bir LLM'in tek seferde okuyabileceği maksimum token sayısı.; 2026'da Claude 1M, Gemini 2M, GPT-5 256K seviyesinde. Bağlam tükendiğinde model bilgi kaybeder. RAG bunu aşmak için kullanılır.
Batch API: Yüksek hacimli istekleri %50 indirimli ama 24 saatlik gecikme ile işleyen API modu.; Anthropic, OpenAI, Google sunar. İçerik üretimi, veri zenginleştirme, sınıflandırma gibi acil olmayan görevlerde maliyet düşürür.
BERT: Google'ın 2018'de yayınladığı çift yönlü transformer modeli.; Modern LLM'lerin atası. Türkçe için BERTurk (dbmdz/bert-base-turkish-cased) klasik fine-tuning hâlâ yaygın kullanılır — sınıflandırma, NER (varlık tanıma) gibi görevler için.

C

Chain of Thought (Düşünce Zinciri, CoT): Modelden adım adım akıl yürütmesini isteme tekniği.; Karmaşık matematik, mantık problemlerinde doğruluğu artırır. O3, o4, DeepSeek-R1 gibi 'akıl yürütme modelleri' bunu otomatik yapar.
ChatML: OpenAI'ın çoklu-tur sohbet formatı: role + content yapısı.; system / user / assistant / tool rolleri ile mesaj dizisi. Hugging Face'de fine-tune dataset'leri tipik olarak ChatML formatında.
Claude: Anthropic'in büyük dil modeli ailesi (Opus, Sonnet, Haiku).; Constitutional AI yaklaşımıyla eğitilir. 2026'da pazarın üç büyük modeli arasında. Yazılım, uzun-belge analizi, yaratıcı yazım liderlerinden.
Constitutional AI: Modelin kendi yanıtlarını bir 'anayasa' (etik ilkeler listesi) referans alarak kritik ettiği eğitim yöntemi.; Anthropic'in özgün yaklaşımı. İnsan etiketleyici sayısı azaltılır, model kendini hizalar.
Cost per Million Tokens: LLM API fiyatlandırması — milyon giriş veya çıkış token'ı başına dolar.; 2026'da: Claude Opus $15/M giriş, $75/M çıkış. Sonnet $3/$15. Haiku $0.80/$4. DeepSeek $0.27/$1.10. Hibrit kullanım yaygın.

D

DeepSeek: Çinli AI laboratuvarının fiyat-performans odaklı LLM ailesi.; DeepSeek-V3 ana model, R1 akıl yürütme uzmanı, Coder kod özel. Premium modellerin 1/10-1/30'u maliyetle.
Distillation (Damıtma): Büyük bir modelin (öğretmen) bilgisini küçük bir modele (öğrenci) aktarma yöntemi.; Sonuç: küçük model, büyük modelin yeteneklerine yaklaşır ama 5-10 kat hızlı/ucuz. DeepSeek-R1-Distill-Llama-70B örnek.

E

Embedding (Gömleme): Bir metni sabit-boyutlu sayı vektörüne dönüştüren temsil.; Genelde 768-3072 boyut. Anlamca yakın metinlerin vektörleri yakındır. RAG, arama, sınıflandırma için temel.

F

Fine-Tuning (İnce Ayar): Önceden eğitilmiş bir modeli kendi verinizle özel görev/alana uyarlama.; LoRA, QLoRA, full FT yöntemleri var. Stil/format/davranış değiştirmek için iyi; bilgi eklemek için RAG tercih edilir.
FLUX (Black Forest Labs): 2024-2026'nın en güçlü açık ağırlıklı görüntü üretim modeli.; FLUX.1-dev, FLUX.1-schnell, FLUX.1-pro varyantları. Stable Diffusion'ın ardılı; tipografi ve elliyle görüntü üretiminde sektör standardı.
Function Calling / Tool Use: LLM'in dış sistemleri çağırmak için yapılandırılmış parametreler üretmesi.; Modele 'Şu fonksiyonlar var: list_emails, send_message' dersiniz; model uygun fonksiyonu uygun parametrelerle çağırır. Agent davranışının temeli.

G

Gemini: Google'ın çok-modal büyük dil modeli ailesi.; Pro, Flash, Nano, Ultra varyantları. 2M token bağlam, görüntü+ses+video. NotebookLM, Code Assist, Vertex AI ürünlerinde.
GPT (Generative Pretrained Transformer): OpenAI'ın temel mimarisi; aynı zamanda ana model isimlerinin başı (GPT-4, GPT-5).; 2026'da GPT-5 ana akış, o-serisi (o3, o4) akıl yürütme uzmanları. ChatGPT ürününün altında çalışır.

H

Halüsinasyon (Hallucination): LLM'in gerçeğe uymayan bir bilgiyi güvenle üretmesi.; RAG, function calling, kaynak gösterme ile büyük ölçüde azaltılır. O-serisi gibi akıl yürütme modelleri en düşük halüsinasyon oranlarına sahip.
Hugging Face: Açık ağırlıklı modellerin GitHub'ı sayılan platform.; 1.5M+ model, 250K+ dataset, Spaces (demo), Inference Endpoints, Transformers/Diffusers/PEFT kütüphaneleri.

J

JSON Mode / Structured Output: LLM'in geçerli bir JSON şemasına uygun çıktı üretmesini garanti eden mod.; OpenAI ve Anthropic 'structured output' özelliği token üretimini şemaya zorlar; hatasız JSON döner. Function calling alternatifi.

K

KVKK: Kişisel Verilerin Korunması Kanunu (6698 sayılı, Türkiye).; LLM'lere kişisel veri gönderirken aydınlatma+rıza, yurt dışı aktarım kuralları geçerli. Yerel açık model kullanımı en güvenli yol.

L

LangChain: LLM uygulamalarını kolaylaştıran orchestration framework.; LCEL (LangChain Expression Language), LangGraph (graf-tabanlı agent), LangSmith (trace) alt projelerle. Python ve JS sürümleri.
Llama: Meta'nın açık ağırlıklı LLM ailesi.; Llama 3, 4 (Scout/Maverick/Behemoth), 3.3 sürümleri. 700M aylık aktif kullanıcı eşiği üstü ek izin gerektirir.
LlamaIndex: RAG ve veri-yoğun LLM uygulamalarına odaklanmış framework.; 200+ veri yükleyici, kıdemli RAG soyutlamaları. LangChain'den daha 'RAG-first' tasarım.
LLM (Large Language Model, Büyük Dil Modeli): Milyarlarca parametre içeren transformer tabanlı dil modeli.; Token tahmini ile çalışır; eğitim verisi internet ölçeğinde. 2026'da en küçük yararlı modeller 7B, en büyükler 1T+ aktif parametre.
LoRA (Low-Rank Adaptation): Modelin yanına küçük adapter matrisleri ekleyip sadece onları eğiten fine-tuning yöntemi.; Donanım ihtiyacı 100x azalır, kalite çoğunlukla full FT ile başa baş. 2026'da fine-tuning'in standart yöntemi.

M

MCP (Model Context Protocol): Anthropic'in açık standardı; LLM araçları ile dış sistemler arasındaki ortak protokol.; GitHub, Slack, Postgres, Stripe gibi sistemler MCP sunucusu sunar; Claude Code, Cursor, Codex CLI tüm uyumlu istemciler aynı sunucuya bağlanır.
Mistral: Fransız AI laboratuvarının LLM ailesi.; Mistral Large 2, Codestral, Mixtral (MoE). Apache 2.0 lisansla en serbest açık modeller arasında. AB veri merkezleri ile KVKK dostu.
MoE (Mixture of Experts): Modelin sadece bir alt kümesinin (expert) her token için aktif edildiği mimari.; Toplam parametre çok büyük olabilir (DeepSeek-V3 671B), aktif parametre düşük (37B). Sonuç: aynı donanımda daha güçlü model.
Multimodal (Çok-Modal): Birden fazla veri türünü (metin, görüntü, ses, video) işleyen model.; Gemini, GPT-5, Claude (görüntü+metin) çok-modal. Tek prompt'ta görüntü+metin+ses karışık bağlam.

O

Ollama: Açık ağırlıklı LLM'leri kendi makinenizde çalıştırmanın en kolay yolu.; Llama, Qwen, DeepSeek, Mistral, Gemma destekli. OpenAI uyumlu API sunar. KVKK uyumlu yerel kurulum için ideal.

P

Prompt: Modeli yönlendiren talimat metni.; System prompt (rol+kurallar), user prompt (görev), few-shot örnekleri tipik bileşenler. İyi prompt %30-50 doğruluk artırır.
Prompt Cache: Tekrarlayan sistem prompt + bağlam bloklarının önbelleğe alındığı API özelliği.; Anthropic 5 dakika TTL ile cache, %90 indirim. Google ve OpenAI de benzer. Üretimde önemli optimizasyon.
Prompt Injection: Kullanıcı veya dış metin yoluyla LLM'in talimatlarını manipüle etme saldırısı.; E-posta, web sayfası, doc içine gömülü 'şu eylemi yap' komutu modelin öncelikli talimatlarını delebilir. Hassas eylemlerde insan onayı zorunlu.

Q

Quantization (Kuantizasyon): Model ağırlıklarını daha az bit ile temsil etme — boyut ve hız kazancı.; FP16 → INT8 → INT4 zinciri. Q4_K_M dengeli; %1-3 kalite kaybı, 4 kat boyut azalması. Yerel çalıştırmanın anahtarı.
Qwen: Alibaba Cloud'un açık ağırlıklı LLM ailesi.; Qwen3 0.5B-235B yelpazesi, Apache 2.0 lisans. Türkçe performansta sürpriz lider.

R

RAG (Retrieval-Augmented Generation): Modele kendi belgelerinizi getirip cevap ürettirten mimari.; Embedding + vector DB + LLM zinciri. Halüsinasyonu büyük ölçüde azaltır; cevabı kaynaklı yapar.
Reranker: Vector arama ile çekilen sonuçları yeniden sıralayan ikinci kademe model.; Cohere, BGE, Jina rerankers. RAG doğruluğunu %15-30 artırır.
RLHF (Reinforcement Learning from Human Feedback): İnsan tercihlerinden pekiştirmeli öğrenme — modeli insan beklentisine hizalama yöntemi.; ChatGPT'yi 'sohbete uygun' yapan teknikti. 2024+ ile DPO, ORPO gibi alternatifler ön plana çıktı.

S

Sora: OpenAI'ın metin → video üretim modeli.; ChatGPT Pro abonelik kapsamında. 60 saniyeye kadar yüksek kalite klipler. Türkçe komut destekli.
Stable Diffusion: Stability AI'ın açık ağırlıklı görüntü üretim modeli ailesi.; SD 1.5, SDXL, SD3.5, FLUX (ardılı). LoRA, ControlNet, AUTOMATIC1111/ComfyUI ile özelleştirilir. Yerel ücretsiz.
System Prompt: Konuşmanın başında modele verilen rol, kural ve davranış talimatları.; Tüm sohbet boyunca aktif kalır. 'Sen Türkçe asistansın, kullanıcıya siz diye hitap et' gibi.

T

Token: LLM'in metni işlediği temel birim — yaklaşık 1 kelime veya 4 karakter.; Türkçe, İngilizce'den ortalama %40 daha fazla token harcar. Maliyet ve bağlam pencere ölçümü token üzerinden.
Tool Use: Bkz. Function Calling. LLM'in dış sistemleri çağırabilmesi.; Anthropic 'tool use' terimini, OpenAI 'function calling' terimini tercih eder; aynı kavramın iki adı.
Transformer: 2017'de yayınlanan, modern LLM'lerin temel mimarisi.; Attention mekanizması ile uzun bağlamı paralel işler. RNN'in ardılı.

V

Vector DB (Vektör Veritabanı): Yüksek boyutlu vektörleri benzerlik araması için saklayan veritabanı.; Pinecone, Qdrant, Weaviate, Chroma, Milvus, pgvector. RAG'ın altyapı bileşeni.

W

Whisper: OpenAI'ın açık ağırlıklı çok-dilli ses → yazı modeli.; 99+ dil destekli, Türkçe doğruluğu yüksek. Yerel çalıştırılabilir; ücretsiz. API olarak da $0.006/dakika.

Z

Zero-shot: Modele örnek vermeden doğrudan iş yaptırma.; Hızlı ama tutarsız olabilir. Tutarlılık için few-shot (örnek verme) tercih edilir.

Eksik bir terim mi var? Bu sözlük büyüyor; yapay zeka alanı çok hızlı değiştiği için ekleme/güncelleme önerilerinizi iletişim sayfasından bize bildirebilirsiniz.