5月20日,微软在其特别活动上,向世界介绍了一种新类别的Windows PC,一款专为AI设计的Copilot+ PC
Copilot+ PC引入了全新的系统架构,将 CPU、GPU 和高性能神经处理单元(NPU)结合在一起,并与 Azure 云中的大语言模型(LLM)和小语言模型(SLM)协同工作,带来前所未有的性能水平。
微软宣称Copilot+ PC是迄今为止最快、最智能的Windows PC。它拥有强大的新型芯片,能够达到惊人的每秒40万亿次操作(TOPS),具备全天电池续航以及访问最先进的AI模型的能力。通过Recall功能,用户可以轻松找到并记住PC中看到的内容;使用Cocreator功能,几乎可以实时在设备上生成和优化AI图像;通过实时字幕功能,可以将40多种语言的音频翻译成英文,从而跨越语言障碍。
新款Copilot+ PC,今天开始接受预订,并将于6月18日开始发货。Copilot+ PC的起售价为999美元,这些设备来自Microsoft Surface以及我们的OEM合作伙伴Acer、ASUS、Dell、HP、Lenovo和Samsung。
视频播放器
Copilot+ PC性能
- NPU 性能:超过 40 万亿次操作每秒(TOPS)
- 电池续航:本地视频播放 22 小时,网页浏览 15 小时
- 应用程序支持:近 90% 的应用程序有原生 Arm 版本,仿真应用性能提升超过 2 倍
通过引入了全新的系统架构,将CPU、GPU以及新的高性能神经处理单元(NPU)的力量结合在一起。与运行在Azure云端的大语言模型(LLM)和小语言模型(SLM)相连并增强,Copilot+ PC现在可以达到前所未有的性能水平。它们在运行AI工作负载时的性能提升高达20倍,效率提升高达100倍,提供行业领先的AI加速能力。
在持续多线程性能上比苹果的MacBook Air 15”快58%,同时提供全天电池续航。在极高的效率下,Copilot+ PC可以在一次充电中提供长达22小时的本地视频播放或15小时的网页浏览时间,这比MacBook Air 15”的本地视频播放时间多出20%。
新款 Surface 笔记本电脑和 MacBook air M3 进行了批量照片编辑对比。他们处理工作的速度几乎是后者的两倍
视频播放器00:0000:00
Copilot+ PC利用强大的处理器和多种最先进的AI模型,包括Microsoft的多款世界级SLM,解锁一系列可以本地运行的新体验。这消除了诸如延迟、成本甚至隐私方面的限制,帮助您提高生产力、创造力并更有效地沟通。
- 高性能处理器:Copilot+ PC 配备了先进的 Qualcomm Snapdragon X Elite 处理器,内置神经处理单元(NPU),能够每秒进行超过 40 万亿次操作(TOPS),提供卓越的 AI 加速能力。
- 电池续航:具有超长电池续航能力,支持长达 22 小时的本地视频播放或 15 小时的网页浏览,满足全天候的使用需求。
- 应用程序性能:近 90% 的应用程序时间都花在了原生 Arm 版本的应用程序上,这些应用程序提供了最高效的性能体验。此外,新的 Prism 仿真器大幅提升了仿真应用程序的兼容性和性能,使其比前一代 Windows Arm 设备快两倍以上。
- AI 加速性能:NPU 性能比 MacBook Air 和 MacBook Pro 快 2 倍以上,为 AI 工作负载提供领先的加速能力,支持高效的本地 AI 应用运行,无需依赖云端处理。
- 多任务处理和效率:Copilot+ PC 的硬件和软件设计优化了多任务处理能力,支持用户在多个应用程序和工作负载之间无缝切换,提高工作效率。
- 安全性能:设备配备 Microsoft Pluton 安全处理器,确保开箱即用的最高级别的 Windows 安全性,保护用户的凭证、商业文件和 Recall 内容。
你现在可以在 PC 上启动 Copilot,它能够看到你电脑上正在进行的一切,当然,也能“了解和理解”你电脑中存储的所有信息。
比如,你正在玩《我的世界》,然后召唤 Copilot:
“嗨,Copilot,今天怎么样?”
“嗨,看起来你正在玩《我的世界》。”
“是的,我想知道怎么制作一把剑。”
接下来,Copilot 会用自然的语音一步步指导你操作,并通过桌面画面了解你已有的物品和原料库中的缺少物品。同时,它会给出具体的按键操作提示,帮助你顺利完成任务。
视频播放器00:0000:00
Windows Recall 即时回忆功能
借助其最新的NPU芯片,微软推出了一个叫做Windows Recall的功能,Windows Recall能够记录用户在PC上的所有操作,包括打开的文件、访问的网站、使用的应用程序等。
利用AI,用户可以通过语音或文本查询,轻松找到特定文件、电子邮件或网页。例如,可以询问“找到老板发的那封邮件“或“上周浏览过的那个网站”。
- 本地语义索引:
- Recall 通过在本地设备上创建一个个人语义索引来管理用户的所有活动。这个索引基于用户在设备上进行的操作和看到的内容进行构建,类似于建立一个个人化的数据库。
- 关系和关联的组织方式:
- Recall 通过分析用户在设备上的所有行为和内容,按照关系和关联的方式组织信息。这种方法模仿人类记忆的方式,帮助用户快速找到模糊记得的内容。
.视频播放器00:0000:00
- Recall 通过分析用户在设备上的所有行为和内容,按照关系和关联的方式组织信息。这种方法模仿人类记忆的方式,帮助用户快速找到模糊记得的内容。
- 时间线功能:
- Recall 提供了一个时间轴视图,用户可以通过时间线来回滚动,找到特定时间点的内容。这种时间轴不仅包含文件和网页,还包括应用程序中的特定操作。
.视频播放器00:0000:00
- Recall 提供了一个时间轴视图,用户可以通过时间线来回滚动,找到特定时间点的内容。这种时间轴不仅包含文件和网页,还包括应用程序中的特定操作。
- 屏幕快照与对象识别:
- 每当用户在设备上执行操作时,Recall 就会自动生成屏幕快照类似于不断的给你的操作进行拍照记录,并使用对象识别技术识别快照中的关键内容和上下文。这些快照可以在用户需要时快速检索。
- 隐私与数据控制:
- 所有的数据和快照都存储在本地设备上,确保用户数据的隐私和安全。用户可以通过设置管理快照的保存范围和时间段,并随时删除不需要的快照数据。
- 智能搜索与提示:
- Recall 提供智能搜索功能,用户可以通过输入模糊的提示词来查找内容。系统会根据用户输入的提示,结合语义索引和快照数据,提供相关的搜索结果和操作建议。
- 跨应用程序整合:
- Recall 能够在多个应用程序之间整合信息,无论是电子邮件、文档还是网页内容,用户都可以通过Recall 快速访问并跳转到相关的应用程序和具体位置。
- 结合NPU(神经处理单元)的高效计算能力,Recall功能可以在本地高效运行,而无需频繁依赖云端计算,从而提高响应速度和用户体验。
Cocreator:在设备上实时生成和优化 AI 图像
Cocreator 是 Copilot+ 个人电脑的一项创新功能,旨在利用先进的 AI 技术提升用户的创意和生产力。
Cocreator 使用户能够在设备上实时生成和编辑 AI 图像,通过自然语言描述快速创建和优化图像。这项功能利用本地神经处理单元(NPU)和小语言模型(SLM),无需依赖云端处理,显著减少了延迟并增强了隐私保护。
主要特点
- 实时图像生成和编辑:用户可以通过简单的文本描述生成图像。Cocreator 使用扩散算法优化生成过程,确保高质量输出,并允许用户在几乎实时的基础上进行迭代和修改。
- 自然语言输入:用户可以使用自然语言描述他们想要创建的图像,例如“生成一个日落的风景”或“创建一张科技感的城市夜景”,Cocreator 会根据描述生成相应的图像。
视频播放器00:0000:00
- 创造力滑块:Cocreator 提供了一个创造力滑块,用户可以调整生成图像的风格,从更具象到更具表现力的范围。用户可以选择和微调他们的艺术作品,以更好地表达他们的创意。
- 无缝集成的编辑工具:生成图像后,用户可以继续对图像进行编辑和迭代。Cocreator 集成了强大的图像编辑工具,使用户能够对图像的细节进行进一步的修改和优化。
- 本地处理和隐私保护:Cocreator 的所有图像生成和处理都在本地设备上进行,利用 NPU 和 SLM,确保数据不需要上传到云端,增强了隐私保护。
- 预设风格和个性化:用户可以使用预设风格(如赛博朋克、黏土动画等)来重新想象他们的照片,改变背景、前景或整个图像,生成全新的视觉效果。
实际应用场景
- 创意设计:设计师和艺术家可以利用 Cocreator 快速生成概念图和创意草图,加速创作过程。
- 营销与广告:营销人员可以通过 Cocreator 生成视觉内容,制作广告素材和社交媒体图像。
- 教育与演示:教师和演讲者可以创建视觉辅助工具,增强教学和演示效果。
- 个人项目:用户可以为个人项目或爱好生成独特的图像和照片,提升个人创意体验。
Live Captions:支持40 多种语言实时翻译
Live Captions 能够将用户在设备上播放的任何音频实时转换为字幕,并支持多语言翻译。这项功能利用本地神经处理单元(NPU)和先进的 AI 模型,提供高效、精准的字幕和翻译服务,增强用户在不同语言环境下的沟通能力。
主要特点
- 实时字幕生成:Live Captions 能够即时将视频通话、录音和流媒体内容中的音频转换为字幕。无论是在观看视频还是参加在线会议,用户都可以实时看到字幕,提高理解和参与度。
- 多语言翻译:Live Captions 支持将 40 多种语言的音频实时翻译成英语字幕。用户可以在不同语言环境下无缝沟通,无需担心语言障碍。
- 离线操作:Live Captions 的字幕生成和翻译功能可以在本地设备上运行,无需依赖互联网连接。这意味着即使在离线状态下,用户也能享受高质量的字幕和翻译服务。
- 隐私保护:所有的字幕生成和翻译过程都在本地设备上完成,确保用户的音频数据不会上传到云端,从而增强了隐私保护。
- 跨应用支持:Live Captions 可以在所有应用程序中一致地显示字幕,无论用户使用的是视频播放器、浏览器还是视频会议软件,都能享受到同样的字幕服务。
- 可定制化:用户可以根据自己的需求自定义字幕的显示样式,包括字体大小、颜色和位置,以便更好地适应个人观看习惯。
- 便捷的操作界面:Live Captions 功能集成在 Windows 操作系统的快速设置中,用户可以轻松启用或禁用该功能,并进行相关设置。
视频播放器00:0000:00
其他新的 AI 体验
包括:
- Adobe:Adobe 的旗舰应用如 Photoshop、Lightroom 和 Express 已经适配,更多应用将在今年夏天推出。
- DaVinci Resolve Studio:使用 NPU 加速的 Magic Mask 技术应用视觉效果。
- CapCut:NPU 上的 Auto Cutout 功能自动移除视频背景。
Copilot+ 个人电脑还将支持多种商业应用,提升生产力、改善协作并提高效率。
Adobe
与Adobe一起,Adobe的旗舰应用将登陆Copilot+ PC,包括Photoshop、Lightroom和Express——今天即可使用。Illustrator、Premiere Pro等将于今年夏天推出。我们还将继续合作优化这些应用中的AI,使其在NPU上运行。
对于Adobe Creative Cloud用户,将受益于Copilot+ PC的全部性能优势,以前所未有的速度表达他们的创造力。
DaVinci Resolve Studio
使用NPU加速的Magic Mask在DaVinci Resolve Studio中轻松对对象和人物应用视觉效果。
CapCut
使用NPU中的自动剪切功能,高效快速的一键移除任何视频剪辑的背景。
Cephable
通过新的NPU支持的摄像头管道,使用头部移动或面部表情等更快、更响应的自适应输入控制保持工作流。
LiquidText
通过完全在设备上运行的AI功能更快、更智能地注释文档,使数据在LiquidText中保持私密。
djay Pro
通过在Algoriddim的djay Pro中独家支持NPU的NeuralMix™功能,享受分解和重新混音任何音乐曲目的乐趣。
全新和增强的Windows Studio效果
通过快速设置中触手可及的控制,自动展示最佳的形象和声音。人像光自动调整图像,以改善在黑暗环境中的照明或在低光环境中亮化前景像素。三种新的创意滤镜(插图、动画或水彩)增添了艺术色彩。眼神交流提词器帮助您在阅读屏幕时保持眼神交流。语音焦点和人像模糊的新改进确保您始终在焦点中。
Copilot将引入GPT-4o
每台Copilot+ PC都配备了您个人强大的AI智能体,只需在键盘上轻按新的Copilot键即可访问。
Copilot现在将拥有客户一直在寻找的完整应用体验,设计简洁但功能强大且个性化。Copilot将最先进的AI模型置于您的指尖。在接下来的几周内,您将可以访问最新的模型,包括我们的合作伙伴OpenAI的GPT-4o,这样您就可以进行更自然的语音对话。
以上内容来自微软官网、博客等渠道,部分视频来自:X @richontech
Stableboost 是一种有趣且简单的方法来释放您的创造力并制作个性艺术化照片的AI工具。