이번 발표에서 가장 눈에 띄는 성능 포인트는 무엇인가요?

Microsoft 공식 발표 기준으로 MAI-Thinking-1은 AIME 2025 97.0%, AIME 2026 94.5%를 제시했고, MAI-Code-1-Flash는 SWE-Bench Pro에서 51.2%를 기록하며 Claude Haiku 4.5 대비 우위를 주장했습니다. MAI-Voice-2는 15개 언어 지원과 72.1% 선호율을 강조했습니다.

Microsoft MAI 7종이 공개한 것들: Thinking·Code·Voice에서 달라진 점

Q: Microsoft가 이번에 발표한 MAI 모델은 몇 개인가요?

Microsoft AI는 2026년 6월 2일 자체 개발한 MAI 모델 7종을 공개했습니다. 핵심 축은 추론 모델 MAI-Thinking-1, 코딩 모델 MAI-Code-1-Flash, 음성 모델 MAI-Voice-2이고, 여기에 이미지·전사 계열 모델이 함께 묶였습니다.

Q: 왜 이 발표가 단순 신모델 뉴스 이상으로 중요한가요?

Microsoft는 모델을 Foundry뿐 아니라 OpenRouter·Fireworks·Baseten에도 배포하고, 처음으로 개발자가 모델 weight를 직접 튜닝할 수 있게 하겠다고 밝혔습니다. 즉 모델 성능 경쟁을 넘어 배포 경로와 운영 주도권까지 같이 잡겠다는 신호로 볼 수 있습니다.

Microsoft MAI 7종이 공개한 것들과 Thinking Code Voice 변화 포인트를 설명하는 타이틀 배너 이미지

AI Market Signal

Microsoft가 이번에는 플랫폼 비전보다 모델 자체를 전면에 세웠습니다. 6월 2일 Microsoft AI는 MAI 모델 7종을 공개했고, 그중 시장이 바로 볼 만한 축은 추론용 MAI-Thinking-1, 코딩용 MAI-Code-1-Flash, 음성용 MAI-Voice-2였어요. Build 2026 글이 에이전트 운영 환경을 보여줬다면, 이번 발표는 그 운영체제 안에 어떤 엔진을 넣을지 공개한 쪽에 가깝습니다. Microsoft AI 발표

이 글에서 봐야 할 포인트는 세 가지예요. 무슨 모델이 새로 나왔는지, 기존 경쟁 모델과 비교해 무엇을 강점으로 밀고 있는지, 왜 Foundry 바깥 배포와 weight tuning까지 같이 묶었는지입니다. Microsoft는 벤치마크 숫자만 던지지 않고, GitHub Copilot·VS Code·Dynamics 365 같은 자사 실행면에 바로 연결되는 모델 라인업을 만들고 있다고 말합니다. 이건 신모델 발표라기보다 유통 채널 선언에 더 가까워요.

한 줄로 줄이면 이렇습니다. Microsoft는 이번에 “우리도 모델을 만든다”를 넘어서 “우리 모델을 어디서, 어떤 비용 구조로, 어떤 제품 안에서 굴릴지까지 같이 정하겠다”는 그림을 내놨어요.

01. Microsoft MAI 7종: 오늘 공개된 업데이트를 먼저 보면 이렇습니다

공식 발표문 기준으로 이번 묶음은 이미지·음성·전사·코딩·추론을 한 세트로 묶은 멀티모달 MAI 제품군입니다. 이름만 많고 체감이 없는 발표는 금방 잊히는데, 이번엔 업무 흐름에 바로 붙는 항목이 꽤 선명했어요.

모델	Microsoft가 내세운 포인트	실사용 힌트
MAI-Thinking-1	35B active, 약 1T total sparse MoE, AIME 2025 97.0%·AIME 2026 94.5%	수학·코딩 추론이 필요한 에이전트형 작업
MAI-Code-1-Flash	GitHub Copilot용 코딩 모델, SWE-Bench Pro 51.2%, 최대 60% 적은 토큰	VS Code·Copilot 안에서 빠른 코딩 보조
MAI-Voice-2	15개 언어, 감정 태그, 72.1% 선호율, zero-shot voice prompting	고객센터·보이스 UX·오디오북·접근성
나머지 4종	이미지 생성·편집, 전사, Flash 변형, weight tuning 지원	Foundry와 외부 배포 채널에서 조합형 운영

Microsoft는 이 모델들을 Foundry뿐 아니라 OpenRouter, Fireworks, Baseten에도 넓게 공급하겠다고 밝혔고, 처음으로 개발자가 모델 weight를 직접 튜닝할 수 있다고 적었습니다. 신모델 성능보다 이 문장이 더 오래 남을 수 있어요. 배포권이 곧 사용량을 만들기 때문이죠. 공식 원문

02. MAI-Thinking-1: Microsoft가 추론 모델에서도 독자 체급을 만들겠다고 한 대목

MAI-Thinking-1은 Microsoft가 이번 발표에서 사실상 간판으로 세운 모델이에요. 공식 페이지에 따르면 35B active, 약 1T total parameter의 sparse Mixture of Experts 구조이고, 제3자 모델 distillation 없이 clean, traceable, enterprise-grade data로 학습했다고 강조합니다. 이 표현은 단순한 미사여구가 아니라, 앞으로도 “우리는 남의 모델을 증류해서 따라가는 팀이 아니다”를 계속 밀겠다는 메시지예요.

성능 주장은 꽤 공격적입니다. Microsoft는 AIME 2025 97.0%, AIME 2026 94.5%를 제시했고, 소프트웨어 엔지니어링 벤치마크에서는 동급 최상위권이며 자사 블라인드 인간 비교 평가에서 Sonnet 4.6보다 선호됐다고 적었습니다. 다만 이런 비교는 모두 Microsoft 발표 기준이니, 실전 평가는 외부 검증이 더 붙어야 해요. 그래도 분명한 건 추론 모델을 그냥 보조 부품이 아니라, 코딩과 수학 문제를 함께 받는 상위 엔진으로 놓고 있다는 점입니다. MAI-Thinking-1 원문

왜 이 숫자가 중요하나

추론 모델은 데모 때는 그럴듯해 보여도, 비용이 너무 크면 실서비스에 못 들어갑니다. Microsoft가 굳이 중간 크기 모델인데도 강하다고 반복하는 이유가 여기에 있어요. 에이전트 시대에는 똑똑함만큼 굴릴 수 있는 체급이 중요합니다.

03. MAI-Code-1-Flash: GitHub Copilot 안에서 바로 써먹겠다는 코딩 모델

MAI-Code-1-Flash는 발표 문구부터 노골적이에요. Microsoft는 이 모델이 GitHub Copilot individual users in Visual Studio Code에 들어가며, model picker와 auto picker에 롤아웃된다고 밝혔습니다. 다시 말해 연구실 공개에서 끝나는 게 아니라, 바로 자사 개발자 표면으로 밀어넣는 모델이에요.

공식 설명에 따르면 이 모델은 Claude Haiku 4.5보다 더 높은 price-to-performance를 주장하고, SWE-Bench Pro 51.2% vs. 35.2%를 포함해 핵심 코딩 벤치마크에서 우위라고 적습니다. 또 최대 60% 적은 토큰으로 더 어려운 문제를 푼다고 했어요. 좋은 모델이 아니라 반응 속도와 비용까지 챙긴 코딩 모델이라는 점을 전면으로 파는 셈입니다. MAI-Code-1-Flash 원문

제가 더 눈여겨본 대목은 벤치마크보다 production harness라는 단어였어요. Microsoft는 개발자가 실제로 쓰는 Copilot 환경과 같은 harness에서 학습·평가했다고 설명합니다. 이건 “점수만 높은 모델” 대신 “지금 GitHub Copilot에 끼워 넣기 쉬운 모델”을 만든다는 얘기예요.

04. MAI-Voice-2와 나머지 4개: 음성·전사·이미지까지 제품형으로 묶였습니다

MAI-Voice-2는 발표 내용이 꽤 실무형입니다. Microsoft는 영어 전용에서 15개 언어로 넓혔고, emotion tag로 감정 제어를 세분화했으며, 5~60초 참조 음성만으로 zero-shot voice prompting이 가능하다고 썼어요. 여기에 consent guardrails도 같이 적었습니다. 이건 음성 모델이 재밌는 장난감이 아니라, 브랜드를 대표하는 고객센터·오디오북·접근성 인터페이스에 들어갈 수 있느냐를 기준으로 설계됐다는 뜻입니다. MAI-Voice-2 원문

선호 테스트 수치도 나왔습니다. Microsoft는 overall quality preference에서 MAI-Voice-2가 72.1% 승률을 기록했다고 공개했어요. 여기에 VS Code와 Dynamics 365 Contact Center 통합도 적었습니다. 음성 모델을 따로 팔기보다, 자사 업무 소프트웨어에 눌러 붙이겠다는 쪽이 더 정확해 보여요.

MAI-Image-2.5: Microsoft는 image editing Arena에서 No. 2라고 소개했습니다.
MAI-Transcribe-1.5: 공식 발표 기준으로 경쟁 모델보다 5배 빠르고, 43개 언어의 도메인 특화 용어를 지원합니다.
MAI-Voice-2-Flash: 더 저렴한 초저비용 음성 패키지로 예고됐습니다.
이 조합은 “한 개 초거대 모델”보다 업무별 전용 모델 묶음 쪽으로 Microsoft가 가고 있다는 신호예요.

05. 왜 중요한가: 이번 발표의 진짜 포인트는 성능보다 배포 경로입니다

요즘 신모델 발표는 넘쳐요. 그래서 남는 건 보통 두 가지뿐입니다. 어디에 바로 붙는가, 누가 비용과 설정 권한을 쥐는가. Microsoft는 이번에 그 두 질문에 모두 답을 줬습니다. GitHub Copilot, VS Code, Dynamics 365, Foundry 같은 자사 표면을 먼저 깔고, 바깥으로는 OpenRouter·Fireworks·Baseten까지 열어놨어요. 게다가 weight tuning까지 말했습니다.

이 구조는 생각보다 큽니다. 개발자 입장에선 “좋은 모델이 또 하나 생겼다”보다 “Microsoft 스택 안에서 독자 모델을 고를 이유가 늘었다”가 더 중요하거든요. 그리고 Microsoft 입장에선 OpenAI 의존을 줄이느냐 아니냐보다, 자체 모델을 실제 유통 채널에 꽂을 준비가 됐느냐가 더 본질적입니다. 이번 발표는 적어도 그 단계까지 왔다는 선언으로 읽힙니다.

FAQ

Q1. Microsoft가 이번에 발표한 MAI 모델은 몇 개인가요?

공식 발표 기준으로 7종입니다. 핵심 축은 MAI-Thinking-1, MAI-Code-1-Flash, MAI-Voice-2이고, 이미지·전사 계열이 함께 묶였습니다.

Q2. 이번 발표에서 가장 눈에 띄는 업데이트는 무엇인가요?

추론 모델에선 AIME 2025 97.0%, AIME 2026 94.5%, 코딩 모델에선 SWE-Bench Pro 51.2%와 최대 60% 적은 토큰, 음성 모델에선 15개 언어와 72.1% 선호율이 Microsoft가 내세운 숫자예요.

Q3. 왜 이 발표가 단순 신모델 뉴스 이상으로 중요한가요?

Foundry 안에서만 돌리는 모델이 아니라 OpenRouter·Fireworks·Baseten 배포, weight tuning, GitHub Copilot·VS Code·Dynamics 365 연결까지 한 번에 묶었기 때문입니다. 성능 경쟁을 유통 경쟁으로 바꾸려는 움직임으로 읽힙니다.

출처

'AI·스타트업 뉴스' 카테고리의 다른 글

Visa Intelligent Commerce가 AI 에이전트 결제를 바꾸는 이유 (0)	2026.06.11
Anthropic Claude Fable 5와 Mythos 5가 AI 접근권 시장을 바꾸는 이유 (0)	2026.06.10
Apple Intelligence와 Siri AI가 아이폰 기본 AI를 바꾸는 이유 (1)	2026.06.09
NVIDIA와 두산이 AI 팩토리 인프라 전쟁을 키우는 이유 (0)	2026.06.08
OpenAI 정부 지분 논의가 AI 자본시장을 바꾸는 이유 (0)	2026.06.07

Asterisk AI·시장 인사이트

Microsoft MAI 7종이 공개한 것들: Thinking·Code·Voice에서 달라진 점

01. Microsoft MAI 7종: 오늘 공개된 업데이트를 먼저 보면 이렇습니다

02. MAI-Thinking-1: Microsoft가 추론 모델에서도 독자 체급을 만들겠다고 한 대목

03. MAI-Code-1-Flash: GitHub Copilot 안에서 바로 써먹겠다는 코딩 모델

04. MAI-Voice-2와 나머지 4개: 음성·전사·이미지까지 제품형으로 묶였습니다

05. 왜 중요한가: 이번 발표의 진짜 포인트는 성능보다 배포 경로입니다

FAQ

출처

'AI·스타트업 뉴스' 카테고리의 다른 글

티스토리툴바

Microsoft MAI 7종이 공개한 것들: Thinking·Code·Voice에서 달라진 점

01. Microsoft MAI 7종: 오늘 공개된 업데이트를 먼저 보면 이렇습니다

02. MAI-Thinking-1: Microsoft가 추론 모델에서도 독자 체급을 만들겠다고 한 대목

03. MAI-Code-1-Flash: GitHub Copilot 안에서 바로 써먹겠다는 코딩 모델

04. MAI-Voice-2와 나머지 4개: 음성·전사·이미지까지 제품형으로 묶였습니다

05. 왜 중요한가: 이번 발표의 진짜 포인트는 성능보다 배포 경로입니다

FAQ

출처

'AI·스타트업 뉴스' 카테고리의 다른 글

관련글

티스토리툴바