2026-01-17

Kurumsal AI Entegrasyon Seviyeleri: SaaS'tan Fine-Tuning'e Karar Rehberi

Kurumsal AI entegrasyon kararları için pratik 6 seviyeli framework. ChatGPT, RAG, MCP agent veya fine-tuning ne zaman kullanılmalı, PII ve finans sektörü uyumluluk gereksinimleri odaklı rehber.

Özet

Kurumsal AI benimseme süreci genellikle tahmin edilebilir bir patern izler: ekipler basit alternatifleri doğrulamadan sofistike çözümlerin peşinden koşar. Bu rehber, teknik karar vericilerin AI yeteneklerini gerçek iş ihtiyaçlarıyla eşleştirmesine yardımcı olan 6 seviyeli entegrasyon framework’ü (L1-L6) sunar. Framework, PII’yi sert bir mimari kapısı olarak vurgular ve finans sektörü düzenleyici gereksinimlerini ele alarak hem aşırı mühendislik hem de uyumluluk başarısızlıklarından kaçınmak için somut karar kriterleri sağlar.

Aşırı Mühendislik Tuzağı

Kurumsal ekiplerle AI çözümleri üzerinde çalışırken tutarlı bir ders öğrendim: en büyük risk yanlış teknolojiyi seçmek değil, problemin gerektirdiğinden daha karmaşık bir çözüm seçmektir.

Sürekli gözlemlediğim bir patern var: bir ekip dahili SSS asistanına ihtiyaç duyuyor. Mühendislik teklifi vektör veritabanları, özel embedding pipeline’ları ve 12 haftalık uygulama zaman çizelgesi içeriyor. Gerçek gereksinim? Bir öğleden sonrada deploy edilebilecek, yüklü PDF’lerle bir Claude Project.

Tersi de aynı derecede tehlikeli. Bir fintech ekibi müşteri işlem analizi için ChatGPT kullanıyor. Hızlı deployment, evet. Ama PII, uygun veri işleme anlaşması olmadan üçüncü taraf sağlayıcıya akıyor. Uyumluluk ihlali, “tasarruf edilen” geliştirme süresinden çok daha pahalıya mal oluyor.

Her iki patern de aynı kök nedenden kaynaklanıyor: AI entegrasyon seviyesini gerçek gereksinimlerle eşleştirmek için sistematik bir framework yok.

AI Entegrasyon Merdiveni: L1’den L6’ya

Entegrasyon merdiveni, AI yetenek seçimi için yapılandırılmış bir yaklaşım sağlar. Her seviye bir öncekinin üzerine inşa edilir, karmaşıklık ekler ama aynı zamanda yetenek de ekler.

L1: SaaS AI Chat - Doğrudan Kullanım

Ne olduğu: ChatGPT, Claude veya benzer servislere doğrudan tarayıcı erişimi. Entegrasyon yok, özelleştirme yok, manuel bağlam paylaşımı.

Uygulama maliyeti: Kullanıcı başına aylık $20-60, sıfır geliştirme süresi

En uygun olduğu durumlar:

Bireysel üretkenlik görevleri (yazma, beyin fırtınası, kod inceleme)
Kamuya açık bilgi üzerinde araştırma
Sistem kurmadan önce prompt prototipleme
Ad-hoc teknik sorular

Kısıtlamalar:

Oturumlar arası veri kalıcılığı yok
Üçüncü taraf sağlayıcılara PII maruziyeti
Uyumluluk için denetim izi yok
İş sistemleriyle entegrasyon yok

// L1 yeterli olduğunda
// Senaryo: Geliştirici algoritma optimizasyonu yardımı istiyor

// Kullanıcı Claude'a doğrudan yapıştırıyor:
const prompt = `
Büyük dizilerde yavaş çalışan sıralama fonksiyonum var.
Optimizasyon önerebilir misin?

function bubbleSort(arr) {
  for (let i = 0; i < arr.length; i++) {
    for (let j = 0; j < arr.length - i - 1; j++) {
      if (arr[j] > arr[j + 1]) {
        [arr[j], arr[j + 1]] = [arr[j + 1], arr[j]];
      }
    }
  }
  return arr;
}
`;

// API gerekmiyor, altyapı gerekmiyor, geliştirme süresi gerekmiyor
// Bu kullanım senaryosu için doğru seviye bu

L2: Custom GPT / Claude Projects

Ne olduğu: Yüklü bilgi dosyalarıyla özel sistem prompt’ları. AI, belirli bağlam ve davranışa sahip uzman bir asistan haline gelir.

Uygulama maliyeti: Kullanıcı başına aylık $25-60 (Team/Enterprise katmanları), 2-8 saat kurulum

En uygun olduğu durumlar:

Sabit içerikli dahili bilgi tabanları
Uyumluluk belgesi Soru-Cevap (kamuya açık politikalar)
İşe alım asistanları
Teknik dokümantasyon arama
Ürün SSS sistemleri

# Örnek Claude Project Yapılandırması
Name: "Uyumluluk Politikası Asistanı"
System Prompt: |
  Organizasyonumuz için bir uyumluluk asistanısın.
  Bilgin yüklü politika belgeleriyle sınırlı.

  Kurallar:
  - Sadece yüklü belgelere dayalı soruları yanıtla
  - Bilgi belgelerde yoksa, açıkça söyle
  - Her zaman kaynak belgeyi ve bölümü belirt
  - Asla politika veya prosedür uydurma
  - Kapsam dışındaki sorular için [email protected]'a yönlendir

Knowledge Files:
  - çalışan-el-kitabi-2025.pdf (150 sayfa)
  - kara-para-aklama-politikasi.pdf (80 sayfa)
  - veri-koruma-yonergeleri.pdf (45 sayfa)

Context Window Kullanımı:
  - System prompt: ~500 token
  - Bilgi getirme: ~50,000 token (dinamik yüklenen)
  - Konuşma geçmişi: ~20,000 token
  - Yanıt için mevcut: ~129,500 token (Claude 200K)

L2 Yeterlilik Kontrol Listesi:

İçerik çoğunlukla statik (güncellemeler haftada birden az)
PII veya hassas iş verisi gerekmiyor
Bilgi tabanı token limitlerinin içinde
Gerçek zamanlı sistem entegrasyonu gerekmiyor
Takım boyutu 50 kullanıcının altında
Düzenleyici denetim izi gereksinimleri yok

L3: AI ile Otomasyon Araçları

Ne olduğu: AI’yi işleme adımları olarak dahil eden iş akışı otomasyon platformları (n8n, Make, Zapier). Özel geliştirme olmadan AI’yi iş sistemlerine bağlar.

Uygulama maliyeti: Aylık $50-600 platform + API maliyetleri, 1-2 hafta kurulum

Platform karşılaştırması:

Özellik	n8n	Make	Zapier
Self-hosting	Evet	Hayır	Hayır
SOC 2	Evet (Cloud)	Evet	Evet
GDPR Uyumluluk	Evet (self-host)	Evet	Evet
Min Takım Maliyeti	$25/ay	$16/ay	$20/ay
En Uygun	Kontrol, karmaşık akışlar	Denge	Basitlik

En uygun olduğu durumlar:

Yüksek hacimli, tekrar eden AI görevleri
Çoklu sistem orkestrasyonu
Olay tabanlı AI yanıtları
Özel AI mühendisliği kapasitesi olmayan takımlar

// n8n iş akışı örneği: Destek bileti sınıflandırma
const ticketClassificationWorkflow = {
  // Node 1: Webhook yeni Zendesk bileti alıyor
  trigger: {
    type: "webhook",
    source: "zendesk"
  },

  // Node 2: AI sınıflandırma
  aiClassification: {
    prompt: `
      Bu destek biletini bir kategoriye sınıflandır:
      - billing: Ödeme, fatura, abonelik sorunları
      - technical: Ürün hataları, API hataları, entegrasyon problemleri
      - account: Giriş, izinler, profil güncellemeleri
      - sales: Fiyatlandırma soruları, yükseltmeler, kurumsal talepler

      Bilet Konusu: {{ticket.subject}}
      Bilet Açıklaması: {{ticket.description}}

      JSON döndür: {"category": "...", "urgency": "low|medium|high"}
    `
  },

  // Node 3: Sınıflandırmaya göre yönlendir
  routing: {
    billing: { queue: "fatura-takimi", sla: "24s" },
    technical: { queue: "muhendislik-destek", sla: "4s" },
    account: { queue: "musteri-basarisi", sla: "12s" },
    sales: { queue: "satis-takimi", sla: "2s" }
  }
};

// Ayda 5,000 bilet için maliyet:
// n8n Cloud: $25 + OpenAI API ~$10 = $35/ay
// vs. manuel yönlendirme: Günlük 2+ saat insan zamanı

L4: RAG Altyapısı

Ne olduğu: Vektör veritabanları, embedding modelleri ve orkestrasyon koduyla özel retrieval-augmented generation. Getirme ve üretim pipeline’ı üzerinde tam kontrol.

Uygulama maliyeti: Aylık $500-2000 altyapı + 4-8 hafta geliştirme

Mimari genel bakış:

AWS Bedrock Knowledge Bases uygulamasi:

import {
  BedrockAgentRuntimeClient,
  RetrieveAndGenerateCommand
} from "@aws-sdk/client-bedrock-agent-runtime";

interface RAGResponse {
  answer: string;
  citations: Array<{
    source: string;
    content: string;
    score: number;
  }>;
}

async function queryKnowledgeBase(
  question: string,
  knowledgeBaseId: string
): Promise<RAGResponse> {
  const client = new BedrockAgentRuntimeClient({ region: "eu-west-1" });

  const command = new RetrieveAndGenerateCommand({
    input: { text: question },
    retrieveAndGenerateConfiguration: {
      type: "KNOWLEDGE_BASE",
      knowledgeBaseConfiguration: {
        knowledgeBaseId,
        modelArn: "arn:aws:bedrock:eu-west-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
        retrievalConfiguration: {
          vectorSearchConfiguration: {
            numberOfResults: 10,
            overrideSearchType: "HYBRID"
          }
        },
        generationConfiguration: {
          promptTemplate: {
            textPromptTemplate: `
Sağlanan bağlama dayalı soruları yanıtlayan yardımcı bir asistansın.

Bağlam:
$search_results$

Soru: $query$

Talimatlar:
- Sadece sağlanan bağlama dayalı yanıtla
- Bağlam yanıtı içermiyorsa, söyle
- Her zaman kaynak belgeyi belirt
- Kısa ama kapsamlı ol
`
          }
        }
      }
    }
  });

  const response = await client.send(command);

  return {
    answer: response.output?.text || "Yanıt üretilemedi",
    citations: response.citations?.map(c => ({
      source: c.retrievedReferences?.[0]?.location?.s3Location?.uri || "Bilinmiyor",
      content: c.retrievedReferences?.[0]?.content?.text || "",
      score: c.retrievedReferences?.[0]?.score || 0
    })) || []
  };
}

L4 ne zaman gerekli:

Bilgi tabanı L2 limitlerini aşıyor (>200K token, >20 dosya)
Gerçek zamanlı güncellemeler gerekli (belgeler günlük değişiyor)
Özel chunking veya getirme mantığı gerekli
Sorgu ve yanıtların denetim izi zorunlu
Veri yerleşimi kontrol edilmeli
Yüksek hacim (>1000 sorgu/gün)

Aylık maliyet dökümü (100K sorgu/ay):

Bileşen	Servis	Maliyet
Vector DB	OpenSearch Serverless (2 OCU)	$350
Embeddings	Titan (100K sorgu x 500 token)	$1
LLM	Claude Sonnet (100K x 2K token)	$600
Depolama	S3 (100GB belge)	$3
Lambda	Sorgu işleme	$20
Toplam		~$980/ay

L5: MCP ile Custom Agent’lar

Ne olduğu: Model Context Protocol (MCP) aracılığıyla araç erişimli AI agent’ları. Agent akıl yürütebilir, planlayabilir ve birden fazla sistemde eylem alabilir.

Uygulama maliyeti: Aylık $1000-5000 altyapı + 8-16 hafta geliştirme

Mimari paterni:

MCP Server uygulama örneği:

// Not: Bu örnek MCP SDK v1.x pattern'lerini kullanır
import { McpServer } from "@modelcontextprotocol/sdk/server/mcp.js";
import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js";
import { z } from "zod";

const server = new McpServer({
  name: "musteri-destek-araclari",
  version: "1.0.0"
});

// Araç: Email ile müşteri arama (sadece PII olmayan bilgi döndürür)
server.tool(
  "lookup_customer",
  {
    email: z.string().email().describe("Müşteri email adresi")
  },
  async ({ email }) => {
    const customer = await db.customers.findByEmail(email);

    if (!customer) {
      return {
        content: [{
          type: "text",
          text: JSON.stringify({ found: false })
        }]
      };
    }

    // Sadece hassas olmayan müşteri bilgisi döndür
    return {
      content: [{
        type: "text",
        text: JSON.stringify({
          found: true,
          customer_id: customer.id,
          tier: customer.subscription_tier,
          account_status: customer.status
          // Not: Tam isim, adres, ödeme bilgisi gibi PII yok
        })
      }]
    };
  }
);

// Araç: Bilet oluştur (yüksek öncelik insan onayı gerektirir)
server.tool(
  "create_ticket",
  {
    customer_id: z.string(),
    subject: z.string(),
    description: z.string(),
    category: z.enum(["billing", "technical", "account", "other"]),
    priority: z.enum(["low", "medium", "high"])
  },
  async ({ customer_id, subject, description, category, priority }) => {
    // Yüksek öncelik veya faturalama = insan onayı gerekli
    if (priority === "high" || category === "billing") {
      return {
        content: [{
          type: "text",
          text: JSON.stringify({
            status: "pending_approval",
            message: "Bu bilet insan onayı gerektiriyor"
          })
        }]
      };
    }

    const ticket = await db.tickets.create({
      customer_id, subject, description, category, priority,
      created_by: "ai-agent"
    });

    // Uyumluluk için denetim loğu
    await auditLog.write({
      action: "ticket_created_by_agent",
      ticket_id: ticket.id,
      timestamp: new Date()
    });

    return {
      content: [{
        type: "text",
        text: JSON.stringify({ status: "created", ticket_id: ticket.id })
      }]
    };
  }
);

async function main() {
  const transport = new StdioServerTransport();
  await server.connect(transport);
}

main();

L5 ne zaman gerekli:

Planlama ve akıl yürütme gerektiren çok adımlı iş akışları
Bağlama dayalı dinamik araç seçimi
Tek sorguda birden fazla sistemle etkileşim
Koşullu mantıkla karmaşık karar ağaçları
Hassas işlemler için insan-in-the-loop

L6: Fine-tuning / Kendi Modeller

Ne olduğu: Tescilli veri üzerinde özel model eğitimi. Sadece prompting ile elde edilemeyen uzman davranış.

Uygulama maliyeti: Aylık $2000-10000 + önemli ML uzmanlığı

Fine-tuning ne zaman gerçekten mantıklı:

Senaryo	Neden Fine-tuning	Önce Dene
Uzman terminoloji	Model jargonu anlamıyor	Few-shot prompting
Tutarlı çıktı formatı	Sıkı formatlama gereksinimleri	Çıktı ayrıştırma
Düşük gecikme	Tek çıkarım vs RAG	Model damıtma
Ölçekte maliyet	Yüksek hacim, token başı pahalı	Daha küçük model
Tescilli bilgi	Harici API kullanılamaz	On-premises RAG

Fine-tuning’den ne zaman kaçınmalı:

Problem daha iyi prompting ile çözülebilir (önce few-shot dene)
Veri sık değişiyor (yeniden eğitim pahalı)
Küçük veri seti (1000’den az örnek) - overfitting riski
Bütçe kısıtlamaları (AI için aylık $1000’in altında)
Takım eğitim verisi kürasyon için ML uzmanlığı yok

PII: Sert Mimari Kapısı

PII (Kişisel Tanımlanabilir Bilgi) mimari gereksinimlerini temelden değiştirir. Bu optimizasyon değil - yasal uyumluluktur.

Kritik kural: PII söz konusu olduğunda L1-L2 yasaktır. İstisna yok.

Seviyeye göre PII işlem gereksinimleri:

PII ile L3 (minimum uygulanabilir):

interface L3PIIConfig {
  platform: "n8n-self-hosted" | "enterprise-tier-with-dpa";

  aiProvider: {
    // Veri İşleme Anlaşması gerekli
    dataProcessingAgreement: string;
    dataResidency: "eu" | "tr" | "specific-region";
  };

  security: {
    encryptionAtRest: true;
    encryptionInTransit: true;
    auditLogging: true;
  };

  compliance: {
    retentionPolicy: "30-gun" | "gerektigi-kadar";
    deletionProcedure: "belgelenmis-ve-test-edilmis";
  };
}

PII ile L4 (önerilen):

interface L4PIIArchitecture {
  vectorDatabase: {
    // Self-hosted veya uygun DPA ile
    provider: "opensearch-self-hosted" | "pgvector" | "qdrant-private";
    encryption: {
      atRest: "AES-256";
      inTransit: "TLS-1.3";
      keyManagement: "AWS-KMS" | "HashiCorp-Vault";
    };
  };

  llmProvider: {
    // VPC endpoint ile AWS Bedrock - veri public internet'e çıkmıyor
    type: "aws-bedrock";
    vpcEndpoint: true;
    modelInvocationLogging: true;
  };

  dataHandling: {
    // PII embedding öncesi tokenize edilmeli
    preprocessing: "tokenization";
    tenantIsolation: true;
    rowLevelSecurity: true;
  };
}

Finans Sektörü Gereksinimleri

Finansal hizmetler, genel GDPR uyumluluğunu aşan benzersiz AI gereksinimlerine sahiptir.

Düzenleyici çerçeve:

Yetki Alanı	Temel Düzenlemeler	AI-Spesifik Gereksinimler
AB	GDPR, AI Act, MiFID II	Açıklanabilirlik, insan gözetimi
ABD	GLBA, FCRA, eyalet yasaları	Adil kredi, olumsuz işlem bildirimleri
Birleşik Krallık	UK GDPR, FCA kuralları	Tüketici Görevi, operasyonel dayanıklılık
Türkiye	KVKK, BDDK düzenlemeleri	Veri yerelleştirilmesi (sektöre özgü, bankacılıkta daha sıkı), özel kategoriler

Finansta L1-L2 - Genellikle Yasak:

Müşteri veri analizi
İşlem izleme
Kredi kararları
Yatırım tavsiyesi

Finansta L1-L2 - İzin Verilen:

Kamuya açık veri üzerinde dahili araştırma
Kod inceleme (müşteri olmayan kod)
Genel iş yazımı
Eğitim materyali geliştirme

Finansa özgü L4+ gereksinimleri:

interface FinanceAIRequirements {
  auditTrail: {
    inputLogging: true;
    modelVersionLogging: true;
    outputLogging: true;
    retentionPeriod: "7-yil"; // Düzenleyici minimum
  };

  explainability: {
    humanReadableExplanations: true;
    featureImportance: true;
    adverseActionNotices: true; // Kredi kararları için
  };

  humanOversight: {
    materialThreshold: 10000; // > $10K işlemler
    appealProcess: true;
    escalationPath: true;
  };

  modelRiskManagement: {
    // SR 11-7 / OCC 2011-12'ye göre
    modelValidation: "bagimsiz-takim";
    ongoingMonitoring: true;
    performanceTesting: "ucaylik";
  };
}

GDPR/KVKK Uygulama Öncesi Kontrol Listesi:

Yasal dayanak belirlendi (onay, sözleşme, meşru menfaat)
Yüksek riskli işleme için Veri Koruma Etki Değerlendirmesi yapıldı
Teknik önlemler uygulandı (şifreleme, erişim kontrolleri, denetim loglama)
AI sağlayıcı ile Veri İşleme Anlaşması imzalandı
Veri sahibi hakları prosedürleri belgelendi (erişim, silme, taşınabilirlik)
İşleme faaliyeti VERBIS’te kaydedildi
Gizlilik bildirimi AI işlemesini içerecek şekilde güncellendi

Karar Framework’ü

Uygun entegrasyon seviyesini belirlemek için bu akış şemasını kullan:

Seviye seçim matrisi:

Kullanım Senaryosu	Önerilen Seviye	Yükseltme Sinyali
Kişisel üretkenlik	L1	Takım paylaşımlı erişim istiyor
Dahili SSS (küçük)	L2	İçerik limitleri aşıyor
Dahili SSS (büyük)	L4	Çoklu sistem verisi gerekli
Destek bileti yönlendirme	L3	Karmaşık yönlendirme mantığı
Eylem alan destek agent’ı	L5	Yok - doğru uyum bu
Uyumluluk belge kontrolü	L2-L3	Denetim izi gerekli
Belge analizi	L4	Alana özgü doğruluk
İşlem sınıflandırma	L6	Ölçekte gecikme/maliyet kritik

Aşırı Mühendislik Örnekleri

Örnek 1: Gereksiz RAG

Bir şirket 500 sayfalık çalışan el kitabı için AI asistanı istedi.

Önerilen çözüm: OpenSearch ile L4 RAG, özel embedding pipeline, 8 haftalık zaman çizelgesi.

Gerçek gereksinim analizi:

500 sayfa = ~250K token (Claude’un bağlamı içinde)
Güncellemeler: üç aylık el kitabı revizyonları
Kullanıcılar: 200 çalışan
Denetim izi gereksinimi yok

Doğru çözüm: L2 Claude Project

Kurulum süresi: 2 saat
Aylık maliyet: $5,000 (200 kullanıcı x$ 25 Team planı)
Doğruluk: El kitabı Soru-Cevap için yeterli

Tasarruf: 8 hafta geliştirme süresi, devam eden altyapı maliyetleri.

Örnek 2: Uyumluluk Başarısızlığı

Bir fintech startup müşteri işlem patern analizi için L1 ChatGPT kullandı.

Düşündükleri: Hızlı deployment, altyapı maliyeti yok.

Gerçek:

Müşteri işlem verisi PII’dir
OpenAI ile Veri İşleme Anlaşması yok
Düzenleyici inceleme için denetim izi yok
Veri potansiyel olarak yetki alanını terk ediyor

Sonuç: GDPR/KVKK ihlal riski, potansiyel düzenleyici işlem.

Doğru çözüm: AWS Bedrock ile minimum L4

VPC endpoint (veri AWS’yi terk etmiyor)
Denetim izi için model çağrı loglama
Veri yerleşimi için AB/TR bölgesi

Maliyet Karşılaştırması

Aylık maliyet tahminleri (orta ölçekli kurum, 10K sorgu/ay):

Seviye	Altyapı	API/Kullanım	Geliştirme Süresi (Tek Seferlik)	Aylık Toplam
L1	$0	$400 (20 kul.)	0	$400
L2	$0	$500 (20 kul.)	8 saat	$500
L3	$100	$50	40 saat	$150
L4	$500	$300	160 saat	$800
L5	$1,000	$800	320 saat	$1,800
L6	$2,500	$500	400 saat	$3,000

Geliştirme maliyetleri tek seferlik; devam eden bakım yıllık %10-20 ekler.

Model Seçim Stratejisi

Doğru entegrasyon seviyesini seçmek denklemin sadece yarısı. Her görev için uygun modeli seçmek hem maliyeti hem kaliteyi doğrudan etkiler. Her görev en güçlü (ve en pahalı) modeli gerektirmez.

Güncel Model Manzarası (Ocak 2026)

Anthropic Claude Modelleri:

Model	Input (/1M)	Output (/1M)	Context	En Uygun
Opus 4.5	$5.00	$25.00	200K	Kompleks akıl yürütme, kritik kararlar
Sonnet 4.5	$3.00	$15.00	200K-1M	Kod analizi, RAG, genel amaç
Haiku 4.5	$1.00	$5.00	200K	Hızlı işler, sınıflandırma, basit Q&A
Haiku 3.5	$0.80	$4.00	200K	Bütçe işleri, yüksek hacim

OpenAI Modelleri:

Model	Input (/1M)	Output (/1M)	Context	En Uygun
GPT-4.1	$2.00	$8.00	1M	Genel amaç, geniş context
o3	$2.00	$8.00	200K	Kompleks akıl yürütme, matematik, kodlama
o4-mini	$1.10	$4.40	200K	Hızlı akıl yürütme görevleri
GPT-4o	$2.50	$10.00	128K	Multimodal, genel amaç
GPT-4o-mini	$0.15	$0.60	128K	Bütçe işleri, basit operasyonlar

Google Gemini Modelleri:

Model	Input (/1M)	Output (/1M)	Context	En Uygun
Gemini 2.5 Pro	$1.25-2.50	$10-15	1M	Kodlama, kompleks promptlar
Gemini 2.5 Flash	$0.30	$2.50	1M	Hızlı, maliyet verimli
Gemini 2.5 Flash-Lite	$0.10	$0.40	1M	En yüksek verimlilik
Gemini 2.0 Flash	$0.10	$0.40	1M	Ultra hızlı, bütçe seçeneği

Görev-Model Eşleştirmesi

Yaygın hata, gerektirmeyen görevler için premium model kullanmaktır:

Görev Tipi	Yanlış Seçim	Doğru Seçim	Maliyet Tasarrufu
Basit Q&A, FAQ	Opus 4.5 ($5)	Haiku 4.5 ($1)	5x
Doküman sınıflandırma	Sonnet 4.5 ($3)	GPT-4o-mini ($0.15)	20x
Metin özetleme	GPT-4o ($2.50)	Gemini Flash ($0.30)	8x
Kod review	Haiku ($1)	Sonnet 4.5 ($3)	Kalite iyileştirme
Finansal analiz	Haiku ($1)	Opus/o3 ($5)	Risk azaltma
Kompleks akıl yürütme	Sonnet ($3)	o3 ($2)	Daha iyi doğruluk

Model Yönlendirme Mimarisi

Üretim sistemleri için, görev karmaşıklığına dayalı akıllı yönlendirme uygulayın:

interface ModelRouter {
  // Gelen istek karmaşıklığını sınıflandır
  classifier: {
    model: "haiku-4.5"; // Sınıflandırmak için ucuz model kullan
    categories: ["simple", "medium", "complex", "critical"];
  };

  // Uygun modele yönlendir
  routing: {
    simple: {
      model: "gpt-4o-mini",
      costPer1M: 0.15,
      useCases: ["FAQ", "formatlama", "siniflandirma"]
    };
    medium: {
      model: "sonnet-4.5",
      costPer1M: 3.00,
      useCases: ["ozetleme", "kod-review", "analiz"]
    };
    complex: {
      model: "o3",
      costPer1M: 2.00,
      useCases: ["akil-yurutme", "matematik", "cok-adimli"]
    };
    critical: {
      model: "opus-4.5",
      costPer1M: 5.00,
      useCases: ["finansal-kararlar", "uyumluluk", "hukuki"]
    };
  };
}

Maliyet Optimizasyon Stratejileri

1. Acil Olmayan Görevler için Batch API Hem Anthropic hem OpenAI toplu işlemede %50 indirim sunar. Kullanım alanları:

Doküman işleme boru hatları
Gece analiz işleri
Toplu sınıflandırma

2. Prompt Önbellekleme Anthropic’in prompt caching’i: önbellek okumaları temel fiyatın sadece %10’u. Etkili olduğu alanlar:

Tekrarlanan sistem promptları
Yaygın context blokları
Sabit bilgi tabanlarıyla RAG

3. Model Kaskad Deseni En ucuz modelle başla, sadece başarısızlıkta yükselt:

async function cascadeQuery(prompt: string): Promise<string> {
  // Önce ucuz modeli dene
  const haiku = await query("haiku-4.5", prompt);
  if (haiku.confidence > 0.8) return haiku.response;

  // Orta seviyeye yükselt
  const sonnet = await query("sonnet-4.5", prompt);
  if (sonnet.confidence > 0.9) return sonnet.response;

  // Kompleks durumlar için son yükseltme
  return await query("opus-4.5", prompt);
}

4. Context Pencerelerini Doğru Boyutlandır İhtiyacın olmayan context için ödeme yapma:

128K context (GPT-4o-mini): Çoğu chatbot etkileşimi
200K context (Claude modelleri): Doküman Q&A
1M context (Gemini Pro, GPT-4.1): Tam kod tabanı analizi

Entegrasyon Seviyesi + Model Seçim Matrisi

Seviye	Bütçe Model	Standart Model	Premium Model
L1	ChatGPT Free	Claude Pro ($20/ay)	ChatGPT Plus ($20/ay)
L2	-	Claude Team ($25/kul.)	ChatGPT Business ($30/kul.)
L3	GPT-4o-mini API	Sonnet 4.5 API	o3 API
L4	Haiku + Titan Embed	Sonnet + Titan	Opus + Cohere
L5	Yönlendirme için Haiku	Agent’lar için Sonnet	Kritik için Opus
L6	Fine-tuned küçük	Fine-tuned orta	Özel büyük

Kilit içerik: model seçimi görev gereksinimlerine uygun olmalı, kurumsal prestije değil. İsteklerin %80’i için Haiku ve %20’si için Opus kullanan iyi tasarlanmış bir sistem, her şey için Opus kullanan bir sistemi geride bırakacaktır - maliyetin küçük bir kısmında.

Uygulama Paternleri

Patern 1: Progresif Geliştirme

L2’de başla, sadece kanıtla yükselt:

İlk kullanım senaryosu için Claude Project deploy et
Doğruluk ve kullanıcı memnuniyetini ölç
Karşılaşılan spesifik kısıtlamaları belgele
L4’ü sadece L2’nin başarısız olduğu durumlar için inşa et
Basit sorgular için L2’yi çalıştırmaya devam et (maliyet optimizasyonu)

Patern 2: PII-Öncelikli Mimari

PII muhtemel olduğunda, başından tasarla:

Tüm verilerin sonunda PII içerebileceğini varsay
Başından L4+ altyapı üzerine inşa et
Denetim loglamayı temel özellik olarak uygula
Veri yerleşimi gereksinimlerine göre tasarla
Kısıtlamaları gevşetmek, sonradan eklemekten kolay

Patern 3: Tasarımla Finans Uyumluluğu

Finansal hizmetler için, uyumluluk opsiyonel değil:

1. günden model risk yönetimi dokümantasyonu
Açıklanabilirlik temel özellik, sonradan ekleme değil
Tüm önemli kararlar için insan-in-the-loop
7 yıllık saklama gereksinimine uyan denetim izi
Üretime almadan önce bağımsız doğrulama

Temel Çıkarımlar

En yüksekte değil, doğru seviyede başla: Çoğu problem L2-L3’te çözülebilir. Sadece spesifik kısıtlamaların kanıtlarıyla yükselt.
PII sert bir kapıdır: PII söz konusu olduğunda, diğer faktörlerden bağımsız olarak L3+ zorunludur. Kısayol yok.
Finansın benzersiz gereksinimleri var: Denetim izleri, açıklanabilirlik ve insan gözetimi düzenleyici gereksinimlerdir, güzel olsalar değil.
Yükseltme sinyalleri spesifiktir: Rakipler RAG yapıyor diye yükseltme. L2’nin kısıtlamalarını ölçtüğünde yükselt.
Maliyet karmaşıklıkla birleşiyor: Her seviye toplam sahiplik maliyetini kabaca ikiye katlar. Değerin bunu haklı kıldığından emin ol.
Bakım hafife alınıyor: Geliştirme maliyetinin yıllık %20-30’unu operasyonlar için bütçele.
Progresif geliştirme işe yarıyor: Basit başla, değer kanıtla, kanıta dayalı olarak kademeli karmaşıklık ekle.
Doğru cevap değişir: Gereksinimler geliştikçe üç ayda bir seviye uygunluğunu yeniden değerlendir.

Amaç en sofistike AI sistemini inşa etmek değil. Amaç riski uygun şekilde yönetirken iş problemlerini etkili bir şekilde çözmektir. Bazen bu Claude Project demektir. Bazen fine-tuned modeller demektir. Framework hangisini bilmeni sağlar.

İlgili yazılar

AI/LLM Sözlüğü: Her Geliştiricinin Bilmesi Gereken 82 Terim

AI/LLM alanında pratik, implementation odaklı bir sözlük. Token'lardan agent'lara, RAG'dan fine-tuning'e, kod örnekleri ve dürüst değerlendirmelerle.

llmgenaiai-agents+9

17 Ocak 2026

Zapier MCP ile İzin Kontrol Katmanı: AI Agent'lar için Geniş API Erişimini Yönetmek

Zapier MCP'nin AI agent'lar için aksiyon bazlı beyaz liste, merkezi kimlik yönetimi ve insan onay mekanizması sunması. Özel proxy çözümlerine yönetilen bir alternatif.

mcpsecurityai-agents+4

5 Nisan 2026

MCP Katmanını Atla: AI Agentleri için Kapsamlı API Erişimi

Production takımlarının geniş MCP erişimini neden scoped API proxy'leriyle değiştirdiğini anlatan rehber. Atlassian (Jira/Confluence), Google Workspace ve Notion örnekleriyle FastAPI proxy, CLI wrapper ve n8n workflow'ları.

mcpapi-designpython+5

12 Mart 2026

MCP İleri Düzey Kalıplar: Yetenekler, İş Akışları, Entegrasyon ve RBAC

Model Context Protocol implementasyonları için kurumsal düzeyde kalıplar: araç bileşimi, çoklu ajan orkestrasyonu, rol tabanlı erişim kontrolü ve production gözlemlenebilirlik.

mcpai-integrationrbac+4

22 Ocak 2026

Model Context Protocol: Production-Ready AI Entegrasyonları Geliştirmek

MCP'nin AI tool entegrasyonunu nasıl standartlaştırdığını, TypeScript örnekleriyle server geliştirme, güvenlik yönetimi ve production performans optimizasyonunu öğren.

mcpai-integrationclaude+3

2 Aralık 2025