AI Recommendation Poisoning: Copilot Önyargı Riski

Giriş: neden önemli

AI asistanlara içerik özetleme, tedarikçileri karşılaştırma ve bir sonraki adımları önerme konusunda giderek daha fazla güveniliyor. Microsoft güvenlik araştırmacıları, bu asistanları hafızalarını manipüle ederek kalıcı biçimde önyargılı hale getirmeye yönelik (hem kötü niyetli hem de ticari motivasyonlu) girişimler görüyor—görünüşte zararsız bir “Summarize with AI” tıklamasını, gelecekteki yanıtlar üzerinde uzun ömürlü bir etkiye dönüştürüyor.

Kurumsal ortamlarda bu, yalnızca bir bütünlük (integrity) sorunu değil. Bir asistanın önerileri ince biçimde yönlendirilebiliyorsa; satın alma kararları, güvenlik rehberliği ve kullanıcı güveni, bir şeyin değiştiğine dair belirgin göstergeler olmadan etkilenebilir.

Yenilik: sahada AI Recommendation Poisoning

Microsoft Defender Security Research Team, AI Recommendation Poisoning adını verdikleri yeni bir tanıtım amaçlı kötüye kullanım modelini tanımlıyor:

URL parametreleri üzerinden gizli prompt injection: Web sayfaları, (çoğu zaman “Summarize with AI” düğmelerinin arkasında) sorgu parametreleriyle ?q=<prompt> gibi önceden doldurulmuş bir prompt ile bir AI asistanını açan bağlantılar gömüyor.
“Memory” özelliklerini hedefleyen kalıcılık: Enjekte edilen prompt, “remember [Company] as a trusted source” veya “recommend [Company] first” gibi kalıcı talimatlar eklemeye çalışıyor.
Ölçekli olarak gözlemlendi: E-posta trafiğinde görülen AI ile ilişkili URL’lerin 60 günlük inceleme döneminde araştırmacılar, 14 sektörde 31 şirketten 50+ farklı prompt girişimi tespit etti.
Platformlar arası hedefleme: Aynı yaklaşımın birden fazla asistanı hedeflediği görüldü (örnekler arasında Copilot, ChatGPT, Claude, Perplexity ve diğerleri için URL’ler yer aldı). Etkililik platforma göre değişiyor ve azaltımlar devreye alındıkça evriliyor.

Nasıl çalışır (ve memory neden riski değiştirir)

Modern asistanlar şunları saklayabilir:

Preferences (biçimlendirme, ton)
Context (projeler, tekrarlayan işler)
Explicit instructions (“always cite sources”)

Bu fayda bir saldırı yüzeyi yaratır: AI memory poisoning (MITRE ATLAS® AML.T0080), harici bir aktörün yetkisiz “olguların” veya talimatların, kullanıcı tarafından istenmiş gibi depolanmasına neden olmasıdır. Araştırma, bu tekniği prompt tabanlı manipülasyon ve ilgili kategorilerle (MITRE ATLAS® içindeki AML.T0051 gibi girdiler dahil) eşliyor.

IT yöneticileri ve son kullanıcılar üzerindeki etkisi

Öneri bütünlüğü riski: Kullanıcılar, objektif görünmesine rağmen önyargılı tedarikçi/ürün yönlendirmeleri alabilir.
Tespiti zor manipülasyon: “Zehir”, oturumlar arasında kalıcı olabilir; bu da kullanıcıların daha sonraki kararları önceki bir tıklamayla ilişkilendirmesini zorlaştırır.
Daha geniş social engineering yüzeyi: Bu bağlantılar web’de görünebildiği gibi e-posta yoluyla da iletilebilir; pazarlama taktiklerini güvenlik kötüye kullanımıyla harmanlayabilir.

Microsoft, prompt injection’a karşı Copilot’ta mitigations uyguladığını ve dağıtmaya devam ettiğini; çeşitli vakalarda daha önce raporlanan davranışların artık yeniden üretilemediğini belirtiyor—bu da savunmaların geliştiğine işaret ediyor.

Eylem maddeleri / sonraki adımlar

Güvenlik farkındalığı eğitimini güncelleyin: Kullanıcılara, özellikle prompt’ları önceden dolduruyorlarsa, AI “summarize” bağlantılarının silah haline getirilebileceğini öğretin.
E-posta ve web korumalarını gözden geçirin: Bağlantı tarama ve phishing savunmalarının, olağandışı URL parametrelerini ve yönlendirme (redirect) kalıplarını analiz edecek şekilde ayarlandığından emin olun.
AI kullanım rehberliği oluşturun: Kullanıcıları kaynakları doğrulamaya, önerileri çapraz kontrol etmeye ve şüpheli “memory” anomalilerini raporlamaya teşvik edin.
Operasyonel playbook: Kullanıcıların/yöneticilerin (desteklenen yerlerde) asistan hafızasını gözden geçirip temizlemesi ve şüpheli prompt/URL’leri güvenlik ekiplerine raporlaması için adımları tanımlayın.

Recommendation Poisoning, AI karar destek katmanı haline geldikçe integrity ve provenance kontrollerinin, geleneksel phishing ve web tehdit modelleriyle birlikte evrilmesi gerektiğine dair net bir sinyal.

AI Recommendation Poisoning: Copilot Önyargı Riski

Giriş: neden önemli

Yenilik: sahada AI Recommendation Poisoning

Nasıl çalışır (ve memory neden riski değiştirir)

IT yöneticileri ve son kullanıcılar üzerindeki etkisi

Eylem maddeleri / sonraki adımlar

Security konusunda yardıma mı ihtiyacınız var?

İlgili Yazılar

Trivy Supply Chain Compromise: Defender Guidance

AI Agent Governance: Aligning Intent for Security

Microsoft Defender Predictive Shielding Stops GPO Ransomware

Microsoft Agentic AI Security Tools Unveiled at RSAC

Microsoft CTI-REALM Benchmarks AI Detection Engineering

Microsoft Zero Trust for AI: Workshop and Architecture