真·硬核! Build 2020: 自研超算挑战全球 Top5,最大语言模型将开源

 2020-05-20 11:07:29   浏览2288人
收藏

有史以来第一次,微软 Build 大会选择在线上召开。

尽管如此,对待今年的 Build 2020 大会,微软依然诚意满满。

微软 Build 大会

比肩全球 Top 5 的 AI 超级计算机,Windows 应用生态 UI 和 API 大统一,Edge 浏览器多项功能更新,Microsoft Teams 大升级、诸多基于 Azure 云计算的功能更新……

这一连串的产品发布或升级,让今年的 Build 大会看点颇多。

更重要的是,作为本次大会最为重磅的环节,本次 Build 大会的 Keynote 开场,充分展示了这家巨头对未来科技发展趋势的洞察和判断,并且也能够让人更加清晰地看到微软在 Azure 云计算、Windows 生态、超级计算、AI 等领域的未来发展思路。

这是一场硬核的开发者大会。

北京时间 5 月 19 日晚间 11 点,本次 Build 大会正式开始。

在二十分钟的暖场环节之后,大会首先迎来的是微软 CEO Satya Nadella 的演讲。

4aa02a4bcc9832d5bd933cf7161828e9.jpg-wh_600x-s_1326382952

他首先谈到了世界各地的开发者如何在新冠肺炎疫情中通过开发工作助力人们的生活,并再次强调了微软的整体战略。

Satya Nadella 表示,开发者对微软非常重要,而微软也已经为之打造了以 GitHub、Visual Studio 和 Azure 为主的工具链条。

由此,Satya Nadella 公布了一些成绩,比如说:

Power 平台拥有超过 350 万个开发者;

Azure 已经被 95% 的世界 500 强公司所采用,并强调 Azure 是全世界的计算机(The World's Computer);

Windows 10 活跃用户已经超过 10 亿;

Microsoft Teams 企业用户在过去两个月增加了 3 倍。

925312ee1fb8d8f6405a95a41a82c45f.jpg-wh_600x-s_1794829840

最后,Satya Nadella 还通过两个互动性案例展示了在新冠肺炎疫情下人们远程合作解决问题、甚至是远程合奏音乐的可能性。

随后环节中,微软开始了 Build 大会最为核心的产品更新发布过程,具体内容介绍如下。

微软 AI 超级计算机来袭,比肩全球前五
2019 年 7 月 22 日,微软宣布与 OpenAI 合作构建新的 Azure AI 超级计算技术。如今,这一合作迎来了新的里程碑——AI 超级计算机。

在 Build 2020 大会上,微软宣布了堪比世界 Top 5 的 AI 超级计算机,它用于训练超大型人工智能模型。微软官方表示,该计算机是与 OpenAI 联合构建的,专为训练 OpenAI 的 AI 模型而设计。这将使下一代超大型 AI 模型和训练这一模型所需的架构成为可供其他机构和开发人员开发的平台——当然,这只是第一步。

这个超级计算机是单个系统,它拥有超过 285000 个 CPU 内核、10000 个 GPU 和 400Gbps 的网络连接。微软表示,与世界 TOP500 超级计算机相比,它居于 Top 5 之列。

在 Azure 中,这个超级计算机还受益于现代云架构的所有功能,包括快速部署、可持续的数据中心和对 Azure 服务的访问。

OpenAI 首席执行官 Sam Altman 表示:

随着我们越来越多地了解到我们所需和组成超级计算机所有组件的不同限制,我们发现,一旦有人能设计出梦想中的系统,微软就能把它构造出来。OpenAI 的目标不仅在于追求研究上的突破,也在于设计和开发其他人可以使用的强大 AI 技术。与微软合作开发的超级计算机旨在加速这一周期。我们看到,更大型的系统是训练更强大模型的重要组成部分。

微软还发布了一个新版本 DeepSpeed,即一个 PyTorch 的开源深度学习库,它减少了大型分布式模型训练所需的计算能力。 与三个月前发布的版本相比,此次的效率要高得多,现在人们可以在同样的架构上训练比此前大 15 倍以上、快 10 倍以上的模型。

此外,微软宣布已经增加了对 ONNX Runtime 分布式培训的支持。ONNX Runtime 是一个开源库,旨在使模型在硬件和操作系统之间移植。

Project Reunion:Windows 应用生态大统一
2020 年 3 月,Windows 10 实现了一个重要的里程碑:其活跃用户超过 10 亿。根据微软官方数据,人们每月花在 Windows 10 上的时间超过 4 万亿分钟,用于工作、学习和连接——同比增长 75%。

由此,微软在本次 Build 大会上推出了 Project Reunion。

Project Reunion 旨在统一 Windows 应用生态平台,并使开发人员摆脱操作系统的限制,轻松地跨 Win32 和 UWP API 集成。

此前,微软一直在 Windows 平台上推动 Win32 程序 API 和 UWP API 的融合,但二者之间一直存在障碍。而 Project Reunion 将统一对现有 Win32 和 UWP 的访问,并通过 NuGet 等工具使它们在与脱离操作系统的情况下可用。

也就是说,这将为新应用程序提供一个通用平台。另外,它将帮助 Windows 开发者更新现有的应用程序并使之具有最新的功能,无论它们是 C++、.NET(包括 WPF、Windows 和 UWP)或 React Native( Facebook 于 2015 年 4 月开源的跨平台移动应用开发框架)。

不仅如此,在分离现有的 API 并添加新的 API 时,微软也在根据需要进行 Polyfill(一个解决兼容问题的开发方案) 操作,因此 API 在支持的 Windows 版本中实现向下兼容。

基于 Project Reunion,微软率先推出了一个全新的 UI 框架:WinUI 3 Preview 1。

真·硬核! Build 2020: 自研超算挑战全球 Top5,Windows 应用全面统一,史上最大语言模型将开源

WinUI 3 Preview 1 是用于 Windows 的现代化本地 UI 框架。WinUI 应用程序可以拥有适应和缩放设备的现代 UI,不管是否新建项目,或逐步升级现有的应用程序(包括 C++、WPF 和 Windows),都将可以拥有这个 UI。

除了 WinUI 3 Preview 1,微软还将 WebView 2 进行扩展预览,该预览可以让开发者在 Windows,WPF 和 UWP/ WinUI 3 应用程序中嵌入基于 Chromium 的 WebView,非常方便。

值得一提的是,微软还正式面向企业用户发布了 Windows Terminal 1.0。

微软 Edge 浏览器更新
Edge 浏览器的更新是微软 Build 大会的常备节目,今年也不例外。在本次 Build 2020 大会上,Edge 浏览器的更新不仅面向开发者和普通用户群体,也选择从公司客户群体的角度切入。

具体的更新内容很有限,包括:

在 Windows 中可以更好地支持 PWA 应用;

改进 Microsoft Edge Add-ons 网站,便于开发人员进行搜索和查找扩展;

集成 Pinterest,使得 Edge 浏览器上的 Collections 将变得更加智能,不仅能够看到相关 Pinterest 建议,还新增了发送至 One Note 的功能;

新增“侧栏搜索”,能够给以更快、更符合上下文的方式进行搜索查找;

数据保护增强,通过“自动切换配置文件”功能,Edge 浏览器对个人和公司数据进行分离,工作账户需要凭证登陆,不会与个人账户混淆。

Bing 搜索将全面变化,当用户使用工作凭证登录到 Bing 时,图片、购物和新闻等内容将出现在其他熟悉的页面旁边。

真·硬核! Build 2020: 自研超算挑战全球 Top5,Windows 应用全面统一,史上最大语言模型将开源

总体来看,今年 Edge 浏览器面向普通用户的更新不多,这也是因为它本身在功能上已经非常成熟;但在面向开发者和企业用户方面,Edge 浏览器依然大有可为。

Azure Synapse Link 公开预览发布
2019 年 11 月,微软发布了 Azure Synapse Analytics,建立起企业数据仓库和大数据分析。不过,操作数据与分析系统并无分开,这使得在事务性与分析性的处理需求不够明晰。由此,在 Build 2020 上,微软发布了一个新工具 Azure Synapse Link 的公开预览。

这是 HTAP (Hybrid Transaction and Analytical Process,混合事务和分析处理,一种新型的应用程序框架,以打破 OLTP 和 OLAP 之间的隔阂,既可以应用于事务型数据库场景,亦可以应用于分析型数据库场景)的一个基于云端的实现。

Azure Synapse Link 能够消除 Azure 操作数据库服务和 Azure Synapse Analytics 之间的障碍,通过一次单击,用户就能够从存储在其操作数据库中的实时交易数据中获得见解,而无需管理数据移动或对其操作系统造成负担。

目前,Azure Synapse Link 可以在 Azure Cosmos DB 中使用,未来将开放其他操作数据库服务,包括 Azure SQL、用于 PostgreSQL 的 Azure 数据库、用于 MySQL 的 Azure 数据库等。

Azure Synapse Link 的基础是微软的云体系结构。客户只需单击他们最喜欢的 Azure 数据库服务中的一个按钮,就可以使用 Azure Synapse Analytics 建立到数据的直接链接。然后,操作数据自动且连续地以优化的柱状结构提供给 Azure Synapse Analytics,类似于覆盖索引。

Microsoft Teams 的新升级
Microsoft Teams 发布于 2016 年 11 月,它是微软推出的 Office 系列应用 ,是一款基于聊天的智能团队协作工具,集会议、电话、聊天和文档共享、协作于一体。伴随着今年疫情导致的远程办公趋势,Microsoft Teams 也火了起来。

在本次 Build 大会上,Microsoft Teams 在生产力和自动化方面都有了新的升级。不仅如此,在会议、通知、远程调度方面,通过与其它应用程序的集成,Teams 也焕发出新的一面,亮点如下:

生产力:用户能够使用可定制模板快速创建团队,每个模板都带有预先定义的通道、应用程序和指南。另外,基于 Power Virtual Agents 应用程序,用户能够更简易地在团队中创建和管理聊天机器人。

自动化:主要表现在 Power 平台与 Teams 的集成和扩展上。通过 Power 平台,用户可以快速添加自定义应用程序和自动化工作流程到 Teams。另外,Power BI 的用户能够简单快捷地将报告共享至 Teams。

会议:通过新应用程序 “Booking”,组织者能够合理安排、管理、执行多个会议议程。

通知:微软 Teams 引入了新的网络设备接口(Network Device Interface,NDI)支持和 Skype TX 互操作性,为公共或私人定制的大规模广播提供了一套产品选项。

远程调度:这主要体现于 Shifts 工具上,其新增的 Power Automation Actions 使开发人员能够从 Shifts 中获取信息,与其他应用程序创建定制工作流或大量执行操作,以此来帮助优化流程、节省时间。

实际上,本次大会的媒体资料,正是通过 Microsoft Teams 工具提前发放的;可以想见的是,在远程办公越来越成为行业趋势的情况下,Microsoft Teams 势必会越来越受欢迎。

Fluid Framework 开源 + 升级
为了帮助团队更好地进行协同创造,微软在去年的 Build 大会上推出了 Fluid Framework(中文可称之为:流体框架)。这是一个基于网页的新型平台,提供了组件化的文档模型以共享互动体验。

在本次 Build 大会上,微软宣布 Fluid Framework 面向开发者开源。

不仅如此,微软对 Fluid Framework 的协作形式进行了升级,旨在打破应用程序之间的障碍,实现无缝协作,此次更新主要体现在 Outlook 和 Office.com 中。值得一提的是,这也是 Fluid Framework 第一次在 Microsoft 365 中集成。

从 Outlook 层面来看,表格、图表和任务列表可以插入到网页版 Outlook 中,由此,用户的销售数据、项目任务和研究报告可以实时更新。

在 Office.com 中,用户可以创建并管理 Fluid Framework 工作区,包括文档活动提要、推荐列表等,或是在 Office.com 上进行搜索。

目前,Fluid Framework 的关键基础设施已开源,基于 Web 的 Fluid Framework 可以使应用程序进行协作,包括执行低延迟同步的数据结构和连接端点的中继服务。

Azure Machine Learning 新工具
在 Build 2020 大会上,微软宣布了一些机器学习相关工具,可以帮助开发人员理解、保护和控制整个机器学习生命周期中的模型。这些工具可以通过 Azure Machine Learning 访问,也可以在 GitHub 上的开放源码中获得。

在隐私方面,微软发布了一个用于区分隐私的工具包——Whitnoise。Azure Machine Learning 还内置了控件,使开发人员能够跟踪和自动化构建、培训和部署模型的整个过程。 这种被许多人称为机器学习和操作(MLOp)的功能提供了审计跟踪,以帮助组织满足法规和合规要求。

史上最大语言模型 Turing-NLG 将开源
在 Build 开发者大会上,微软宣布将很快开始开源微软图灵模型,以及在 Azure 机器学习中训练它们的方法。因此开发人员能够访问微软来提高其产品之间语言理解的一系列语言模型。

目前,用于自然语言生成(NLG)的微软图灵模型是世界上最大的公开可用的语言 AI 模型,具有 170 亿个参数。这类新模型的学习与监督学习模型不同,它是采用“自我监督”学习。

在“自我监督”学习中,这一人工智能模型可以通过查看互联网上数十亿页的公开文档——维基百科条目、出版的书籍、指导手册、历史课、人力资源指南——来学习语言。在类似于疯狂口诀的大型游戏中,单词或句子被移除,该模型必须基于上下文来预测缺失的部分。

它也可精准识别语言、语法、知识、概念和语境的细微差别,无论是总结冗长的演讲,还是在数千个法律文件中查找相关段落,都可以胜任。

由于这个模型已经重复过几十亿次上述游戏了,因此非常善于感知单词之间的相互联系,对语法、概念、语境和其他语言构成要素有着丰富的理解。它还允许相同的模型在许多不同的语言任务中传递培训经验,从文档理解到回答问题、再到创建会话机器人。

同时,这一人工智能模型只需要接受大量数据和超级计算资源的一次训练,然后针对不同任务对较小的数据集和资源进行微调。

微软表示,它也在探索其他的大规模 AI 模型,这些模型可在文本、图像和视频中以一般化的方式学习。例如,这可以帮助在 Office 中自动为图像添加字幕以方便访问,或者通过了解图像和视频中的内容来改进人们使用 Bing 搜索引擎的方式。

微软 CTO Kevin Scott 表示:

通过开发这种用于训练大型人工智能模型的前沿架构,我们正在让 Azure 变得更好。我们正在建设更好的计算机、更好的分布式系统、更好的网络、更好的数据中心。这些都会推动整个 Azure 的性能、成本和灵活性变得更好。

面向医疗行业的云服务
在 Build 2020 大会上,微软宣布了其首个针对特定行业的云服务——Microsoft Cloud for Healthcare(微软云医疗服务),目前已公开预览,并将在未来 6 个月免费试用。

Microsoft Cloud for Healthcare 不仅能够助医疗保健组织以更主动的方式与患者互动,使护理人员能够提高其工作流程的效率,还能够扩展 Dynamics 365 营销、Dynamics 365 客户服务以及 Azure IoT 的价值。

基于此,护理团队可以轻松创建针对患者就医过程的增强分析;患者在看病时也可以实现在线预约、提醒、账单支付等多种医疗任务,并且还能够通过 IoT 持续监测患者,升级护理。

另外,在 Microsoft 365 和 Microsoft Teams 的功能构建中也包括了医疗服务,比如“Booking”应用程序,使医疗保健提供商能够在团队中安排、管理和进行“Microsoft 机密提供商到患者”的虚拟访问。

在新冠疫情形势依旧严峻的当下,Microsoft Cloud For Healthcare 的推出可以说是恰逢其时了。

雷锋网总结
一场大会下来,微软给人的感觉是:它离普通用户越来越远了。

的确,对微软来说,Build 大会越来越变成了一个面向开发者和行业用户的会议;而与普通用户群体关联更为密切的 Windows 10 和 Office 365,已经成为 Microsoft 365 的一个组成部分。

不得不承认,Windows 10 还不够完善,它在本次 Build 大会上还有应用生态层面的更新;但 Windows 10 已经变成了整个微软开发生态的一个躯壳,或者是一个容器,承载着微软在 AI 和 Azure 云计算方面的用户端口。

但也许正是因为如此,Build 大会才越来越彰显它面向开发者的本质。

正如 Satya Nadella 所言,如今的微软已处在 Intelligent Cloud & Intelligent Edge 的时代,也正处于全球各类企业面向数字化转型的时代。在这样的新时代,微软越来越依赖众多开发者的参与,从而在开源上着力甚多;而从产品上来说,以 Azure 和 Microsoft 365 等产品为载体,微软将众多前沿技术融入其中,从而赋能开发者。

总体来看,微软越来越深入地走向它正在践行的新任务,即帮助全球各种各样的企业进行数字化转型;当然,在这个过程中,微软也正在实现自己面向未来的另一次转型。

某种意义上,这也正是微软自己的 Hit Refresh。

免责声明:如转载稿涉及版权等问题,请立即联系管理员,我们会予以更改或删除相关文章,保证您的权利。