Azure

Claude Sonnet 4.6 in Microsoft Foundry: 1M Kontext

3 Min. Lesezeit

Zusammenfassung

Claude Sonnet 4.6 ist jetzt in Microsoft Foundry verfügbar und bringt ein Kontextfenster von bis zu 1 Million Token (Beta), bis zu 128K Output sowie adaptive Thinking- und Effort-Steuerungen für den gezielten Ausgleich zwischen Qualität, Latenz und Kosten. Das ist besonders relevant für Unternehmen, die große Codebasen, umfangreiche Dokumente oder komplexe Agenten-Workflows in einer gemanagten Azure-Umgebung betreiben und dabei leistungsfähige KI ohne das höchste Kostenprofil benötigen.

Audio-Zusammenfassung

0:00--:--
Brauchen Sie Hilfe mit Azure?Mit einem Experten sprechen

Einführung: warum das wichtig ist

Claude Sonnet 4.6 ist jetzt in Microsoft Foundry verfügbar und gibt IT- und Engineering-Teams eine weitere „frontier-class“-Modelloption an die Hand, die auf großskalige Enterprise-Workloads zielt—ohne immer das Premium-Kostenprofil von Top-Tier-Modellen zu benötigen. Für Organisationen, die Developer-Copilots, Wissensarbeits-Assistenten und Automatisierungs-Agenten entwickeln, soll Sonnet 4.6 Intelligenz, Durchsatz und governance-freundliche Bereitstellung in einer gemanagten Umgebung ausbalancieren.

Was ist neu in Claude Sonnet 4.6 (in Foundry)

Massiver Kontext + große Outputs

  • 1 Million Token Kontextfenster (Beta), entsprechend der erweiterten Kontextstufe, die für Claude Opus 4.6 genannt wird.
  • Bis zu 128K maximaler Output, wodurch längere generierte Artefakte (Reports, Code-Änderungen, mehrstufige Pläne) in einer einzigen Antwort möglich werden.
  • Praktischer Vorteil: weniger „Context Chopping“ für große Codebases, lange Finanzmodelle, Multi-Document-Review und langlaufende Multi-Turn-Agent-Workflows.

Adaptives Thinking und „Effort“-Controls

  • Sonnet 4.6 führt adaptive thinking ein, wodurch das Modell nur bei Bedarf tieferes Reasoning anwendet.
  • Effort-Parameter bieten eine Möglichkeit, den Trade-off Qualität–Latenz–Kosten für unterschiedliche Aufgaben zu justieren (z. B. schnelle Triage vs. High-Assurance-Analyse).

Developer-fokussiertes Upgrade (vs. Sonnet 4.5)

Microsoft hebt Sonnet 4.6 als direktes Upgrade zu Sonnet 4.5 hervor, bei dem für die meisten Workflows nur minimale Prompting-Änderungen erforderlich sind. Betonte Verbesserungen umfassen:

  • Stärkeres Reasoning über breiteren Code-Kontext hinweg
  • Besseres Verständnis komplexer Codebases
  • Zuverlässigere Performance über iterative Development-Zyklen (Feature-Build, Refactor, Debug, Refine)

Verbesserte Knowledge Work im Maßstab

Für Enterprise-Content- und Analyse-Workflows zielt Sonnet 4.6 auf weniger Überarbeitungszyklen ab für:

  • Report-Entwürfe und -Verfeinerung
  • Zusammenfassen großer Dokumentensammlungen
  • Strukturierte Business-Dokumentation
  • Presentation- und Narrative-Generierung

„Computer use“ für Browser-Automatisierung

Sonnet 4.6 wird als Anthropics bislang leistungsfähigstes computer use-Modell beschrieben und erreicht 72,5% auf OSWorld Verified. Zentrale Enterprise-Implikationen:

  • Automatisiert browserbasierte Aufgaben ohne Abhängigkeit von einer API (nützlich für Legacy- und SaaS-Tools mit eingeschränkter Integration).
  • Verbesserte Präzision bei UI-Interaktionen (z. B. schwierige Klickziele).
  • Kann zwischen Web-Apps wechseln und mehrstufige Aufgaben abschließen (z. B. Kontext lesen, auf eine Nachricht antworten, einen Kalendereintrag erstellen).

Auswirkungen für IT-Admins und Platform-Teams

  • Architekturentscheidungen: Sonnet 4.6 kann als kosteneffizientes Default-Modell für High-Volume-Chat, Dokument-Workflows oder als Sub-Agent in Multi-Model-Pipelines dienen.
  • Automatisierungs-Reichweite: Browserbasierte Automatisierung erweitert die Möglichkeiten dort, wo keine APIs existieren, erhöht jedoch den Bedarf an Guardrails, Auditing und Least-Privilege-Access.
  • Operational Governance: Die Bereitstellung über Microsoft Foundry positioniert Teams so, dass Model-Usage mit Enterprise-Erwartungen an Governance, Compliance und Operational-Tooling ausgerichtet werden kann.

Action Items / Next Steps

  1. Sonnet 4.6 in Foundry pilotieren für ein High-Context-Szenario (z. B. repo-weites Code-Assistant, Policy-/Dokumentanalyse), um die Vorteile des 1M-Kontexts zu validieren.
  2. „Effort“-Profile definieren (low/medium/high), gemappt auf Task-Klassen, um Kosten und Latenz zu steuern.
  3. Computer-use-Automationen in einer Sandbox evaluieren: mit nicht-destruktiven Workflows starten (Read-only-Validierung, QA-UI-Checks), bevor transaktionale Aktionen aktiviert werden.
  4. Model Mondays (23. Feb.) besuchen für Guidance von Anthropic zu Opus 4.6- und Sonnet 4.6-Architekturen sowie Enterprise-Deployment-Patterns.

Brauchen Sie Hilfe mit Azure?

Unsere Experten helfen Ihnen bei der Implementierung und Optimierung Ihrer Microsoft-Lösungen.

Mit einem Experten sprechen

Bleiben Sie über Microsoft-Technologien auf dem Laufenden

Azure AI FoundryClaude Sonnet 4.6generative AIagentsenterprise automation

Verwandte Beiträge

Azure

Microsoft Podcast zu Agentic AI: The Shift gestartet

Microsoft startet mit „The Shift“ eine neue Podcast-Reihe, die sich in acht Folgen auf Agentic AI konzentriert und Themen wie Datenzugriff, Multi-Agent-Orchestrierung, Context Engineering, Plattformen wie Postgres, Fabric und OneLake sowie Governance behandelt. Das ist wichtig, weil Microsoft damit deutlich macht, dass AI Agents kein isoliertes Feature sind, sondern tiefgreifende Auswirkungen auf Architektur, Sicherheit, Observability und die Organisation von IT-Teams in Unternehmen haben.

Azure

Azure Agentic AI für Cloud-Modernisierung in Branchen

Microsoft betont in einem Branchen-Update, dass Azure zusammen mit Agentic AI regulierten Unternehmen helfen soll, die Cloud-Modernisierung von punktuellen Migrationen hin zu einem kontinuierlichen, stärker automatisierten Prozess weiterzuentwickeln. Das ist wichtig, weil neben Kostensenkungen vor allem AI-Bereitschaft, Resilienz und Compliance zu zentralen Treibern werden – besonders für Branchen mit komplexer Legacy-IT und strengen regulatorischen Vorgaben.

Azure

Fireworks AI auf Azure: Public Preview in Foundry

Microsoft stellt Fireworks AI in der Public Preview auf Azure Foundry bereit und kombiniert damit schnelle Open-Model-Inferenz mit zentralem Enterprise-Management, Governance und einem einheitlichen Azure-Endpunkt. Das ist wichtig, weil Unternehmen Open Models wie DeepSeek V3.2, gpt-oss-120b, Kimi K2.5 und neu MiniMax M2.5 einfacher vom Test in die Produktion bringen können – inklusive serverloser Nutzung und Bring-your-own-weights für angepasste Modelle.

Azure

Azure Copilot Agents für Migration und Modernisierung

Microsoft erweitert Azure Copilot und GitHub Copilot um neue agentenbasierte Funktionen für Migration und Modernisierung, darunter einen Azure Copilot migration agent und einen GitHub Copilot modernization agent, die beide in Public Preview verfügbar sind. Die Neuerungen sollen IT- und Entwicklungsteams dabei helfen, Infrastruktur, Anwendungen, Datenbanken und Code effizienter zu analysieren, zu planen und zu modernisieren – wichtig, weil sie Unternehmen den Weg zu skalierbarer AI-Nutzung und kontinuierlicher Transformation deutlich erleichtern.

Azure

Azure IaaS Resource Center für resiliente Infrastruktur

Microsoft stellt mit dem Azure IaaS Resource Center einen zentralen Einstiegspunkt für Infrastrukturteams vor, der Best Practices, Architekturleitfäden, Demos und Betriebsempfehlungen für Compute, Storage und Networking bündelt. Das ist wichtig, weil Unternehmen ihre Azure-IaaS-Umgebungen damit ganzheitlicher auf Resilienz, Performance und Kosten optimieren können, statt einzelne Dienste isoliert zu betrachten.

Azure

Microsoft Foundry: 327 % ROI laut Forrester-Studie

Eine neue Forrester-TEI-Studie zu Microsoft Foundry kommt zu dem Ergebnis, dass Unternehmen mit der Plattform über drei Jahre einen ROI von 327 % erzielen und ihre Investition bereits nach sechs Monaten amortisieren können. Relevant ist das vor allem für IT-Administratoren und AI-Teams, weil Foundry laut Studie versteckte Kosten durch Infrastruktur-, Governance- und Tooling-Aufwand senkt, Entwickler produktiver macht und gleichzeitig Einsparungen bei redundanten Systemen ermöglicht.