Исследовательское подразделение Microsoft AI представило три новые модели искусственного интеллекта (ИИ), способные генерировать текст, голос и изображения. В конкурентной борьбе с ведущими технологическими ИИ-лабораториями компания решила усилить свои позиции сделав ставку на собственную мультимодальную инфраструктуру.
Содержание статьи
- 1 Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone
- 2 Обзор Ryzen 7 9850X3D: три процента за двадцать баксов
- 3 Компьютер месяца, спецвыпуск: эпоха отката, или Как дефицит чипов памяти влияет на выбор железа для игрового ПК
- 4 От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте
- 5 Обзор ноутбука HONOR MagicBook X16 2026: как раньше, только лучше
- 6 Гид по выбору OLED-монитора в 2026 году: эволюция в деталях
- 7 Обзор Samsung Galaxy Z TriFold: тройной складной смартфон по цене квартиры в Воркуте
- 8 Ryzen и 16 Гбайт DDR5: как сэкономить на памяти так, чтобы не лишиться 15 % производительности
Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone
Обзор Ryzen 7 9850X3D: три процента за двадцать баксов
Компьютер месяца, спецвыпуск: эпоха отката, или Как дефицит чипов памяти влияет на выбор железа для игрового ПК
От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте
Обзор ноутбука HONOR MagicBook X16 2026: как раньше, только лучше
Гид по выбору OLED-монитора в 2026 году: эволюция в деталях
Обзор Samsung Galaxy Z TriFold: тройной складной смартфон по цене квартиры в Воркуте
Ryzen и 16 Гбайт DDR5: как сэкономить на памяти так, чтобы не лишиться 15 % производительности
Источник изображения: xAI
Модель MAI-Transcribe-1 переводит речь на 25 языках в текст, опережая по скорости сервис Azure Fast в 2,5 раза. Вторая модель MAI-Voice-1 создаёт минутную аудиодорожку за одну секунду и поддерживает настройку голосов. MAI-Image-2 отвечает за генерацию визуального контента по текстовому описанию.
По сообщению TechCrunch, над проектом работала команда MAI Superintelligence, занимающаяся фундаментальными исследованиями в области продвинутых ИИ-систем, которую в ноябре 2025 года возглавил исполнительный директор подразделения Мустафа Сулейман (Mustafa Suleyman).
В текущем проекте разработчики сделали упор на снижение стоимости вычислений по сравнению с аналогами от Google и OpenAI. Тарификация расшифровки текста начинается от $0,36 в час, синтез речи оценивается в $22 за 1 миллион символов, а работа с изображениями обойдётся в $5 за 1 миллион входных токенов и $33 за генерацию 1 миллиона выходных токенов. Все модели уже развёрнуты на платформе Microsoft Foundry, а модели транскрипции и синтеза речи также доступны в MAI Playground.
Несмотря на активный выпуск собственных разработок, Сулейман в интервью VentureBeat подтвердил приверженность партнёрству с OpenAI, в которую Microsoft уже инвестировала более $13 млрд. Корпорация продолжит использовать модели OpenAI в своих продуктах в рамках многолетнего контракта, применяя ту же стратегию диверсификации, что и при работе с микрочипами.
