AICon 深圳站 Keynote 嘉宾官宣!共探AI价值转化的实践路径 了解详情
写点什么

从 Build 2019,看微软 AI 背后的同理心、多元化与对更高智能的探索

  • 2019-05-11
  • 本文字数:3457 字

    阅读完需:约 11 分钟

从Build 2019,看微软AI背后的同理心、多元化与对更高智能的探索

为时三天的微软 Build 2019 大会结束了。

从美国西雅图雷德蒙德微软总部园区走出来的刹那,蓝天、草地将这座孵化孕育了无数黑科技的场所映照得格外动人,而从全球各地列队来参观的人群、停摆在街区两旁的游客车辆,使这里的科技交融、引领时代的文化复兴革命更具包容性、多元化。

如果不亲身感受一次 Build,不来雷德蒙德听听一项技术的诞生,也许真的不算懂微软。


从最初的操作系统到如今的智能云平台,微软的技术迭代正如萨提亚所说,第一,它正在重塑生产力和业务流程;第二,通过智能云平台的建设,为开发者世界注入不同的、多样的可能选择,无论是应用程序平台、开发工具、基础设置还是各类的认知服务,通过 API 接口、通过接入可扩展的解决方案,微软正让更多的初创、大中小企业释放生产力;第三,创造更个性化的计算,推动人们从需要 Windows 到爱上 Windows。


所以你可以看到,跨设备、端到端正在微软的技术容器里得以生息繁衍:个人计算机、Xbox、HoloLens、Windows 混合现实设备、Azure 等等。


在今年的 Build 大会上,以上这些主角都无一例外没有缺席。


基于 Azure 和 Windows 365,记者数了数,今年的相关发布大约将近 100 项,尤其以 Azure 相关的居多,约占到了总数的 60%,其中,AI 相关的又占到了 60%当中的 20%以上(根据非科学统计法统计,部分与 AI 有交集或由 AI 技术赋能的发布不包含在内。当然,这个数字的占比已算非常之高了)。


而在 Windows 365 相关的发布中,Windows Terminal、React Native for Windows、Windows Subsystem for Linux 2 等又堪称开发世界的具有变革性意义的迭代。


可见,开发者在微软的战略蓝图中已经成为了至上的一环。微软期待将面向开发者的服务带上独一无二、一站式的、安全透明的使用列车中。


那么,这些创新如何让开发者重新刷新对微软的认知?又如何阐释微软的商业愿景呢?


在揭示微软的愿景或指导性原则时,Azure 产品营销总监 Bharat Sandhu 提到 Azure AI 时阐述说:


Azure AI 使得更多组织在推进 AI 的应用中变得更具可能性和前瞻性,开发者或者 AI 用户可以加快 AI 在商业化场景中的落地。原先,很多人一直认为机器学习技术来源于学术研究,走不出象牙塔。但是现如今不同的深度学习模型、框架、平台,不同的选择,使得用户能够更好地构建机器学习技术的基础。同时,微软的一项重要原则就是,绝对不拿客户的任何数据,这象征了微软对安全透明、客户隐私的保障。


如何解释 Azure AI 在快速地帮助用户解决当下 AI 商业化应用的困境呢?这里举一个例子。


微软重视 AI,有趣的是,尤其是在文本、语音语义理解层面的 AI,微软更是对其痴爱。


还记得本次 Build 大会上,一项名为 Azure Speech Service 的工具,刚一发布就引来众多热议吗?如果你看了 Build 的直播,那相信对于下面图中的这段会议室内的会话转录场景有一些印象:



Azure Speech Service 这项工具的作用是可以快速识别不同人物对话,并实时将语音精准转化成为文本。


也许你会说,这也没有什么特殊啊!市面上类似工具不是不胜枚举了嘛!尤其是 Amazon、Google 等一众公司都对外发布过自己的专业语音转译 API 工具。


虽然本质上不能否认几款工具的同类性,但其实业界对于转译的精确度(尤其是在某些专业语境中)及上下文的理解转换上是存在较多诟病的。因此不得不提的是,Azure Speech Service 对于专业名词谈话所涉及的领域具有非常高的识别度,而且能自动识别并切换不同的对话人。这其中,基于自适应的方式,Azure Speech Service 会不断优化生成的文本内容。


在参观雷德蒙德微软总部园区的过程中,微软的三位专家也特意对这款工具安排了一场 demo 演示。现场,通过一套“虚拟”麦克风阵列(一台笔记本电脑、一台手机),就可以实现实时转译(关于这项转译的相关技术原理可参考本文)。在实时转译过程中,记者发现它对于 Node.js 、RESTful 这种专业术语确实能够较为精确的识别,在多人多轮交叉式对话场景中,通过对声纹的鉴定与识别,能够快速精准匹配到不同个体的发言场景。



其实,这背后所采用的优化方法和流程和微软在优化改进机器阅读理解上所描绘的原理其实是类似的,即将多个相关任务学习到的信息进行整合及关联,在目标任务上精调模型。


早在一周前,微软团队在一项名为 CoQA——Conversational Question Answering 的挑战赛上获得了桂冠。而这项挑战赛就是旨在衡量机器解释文本、机器阅读理解、在对话中回答一系列相互联系的问题。而此次 CoQA 上的研究成果,也被视为微软 AI 历史中的一次里程碑事件。


除此之外,增强机器人的会话能力也被很多 AI 解决方案提供方视为最关心的问题之一。


试想,如果和你对话的机器人拥有强烈的人格,能在激动、愤怒、开心等不同的情绪下给你回应,是多么有意思的一件事情!如果得到成熟化应用,甚至可能改变人类的生活模式和文化。所以,很多企业都会投入到对机器人人格塑造的技术研究中。


在去年的 Build 上,微软就对外发布了一个名为 Personality Chat 的项目。对于微软而言,该项目扩展了 Cortana 工作的多样性,通过对深度神经网络会话模型的训练,使得对话机器人能在各种不同的情绪中产生不同的反应,形成个性化的机器人。记者在微软 Personality Chat 官网上也随机做了一段测试,可以看看不同情绪下的 Bot 怎么给予回应:



在雷德蒙德微软园区的参观中,两位微软的技术专家也对该项目进行了介绍及演示。负责微软 Windows 和文本智能用户体验的专家 Jonathan Foster 提到说:


微软不是仅仅只让人类硬生生地连接到计算机、手机等硬件设备中,还是要让人和设备之间产生情感上的接触,来设计一种移情体验,让交互的过程更加情绪化。


微软 CEO 萨提亚也曾在他的《刷新》一书中提过,在推动人工智能发展的过程中,最重要的步骤就是对人工智能设计达成一个伦理和同理心的框架。相信这里提及的同理心,不仅是机器之于人的同理,也包括人之于机器的同理。Personality Chat 的项目其实从某种层面上是对后者的一项实践,即让人类明白机器就是机器,它不可能达成人类所期望的一切可能的回应,但如果人类赋予其对话的使命,就要看到其应该存在的不同情绪和部分类人行为。


当然,微软 Azure AI 远不止赋能于语音语义转译与理解的场景,毕竟太多的应用场景和案例可以值得被提及,包括计算机视觉、个性化推荐及搜索、自动化系统等等,都在本次 Build 上进行了一一亮相。


微软技术专家 Alex 在访谈时介绍说,当前 Azure 机器学习解决方案的目标用户分为三类:


  • 第一类是个体的数据工程师,应用微软的服务来更简单、更直接地训练他的模型,提高模型开发的周期;

  • 第二类是企业级用户,微软不仅给企业级用户更安全的数据保障,还提供更有效的资源管理,帮助他们节省成本;

  • 第三类是一些 ISV,也就是微软的合作伙伴们。作为一个机器学习服务的提供者,他们给用户提供自己的平台。微软的 Azure 机器学习相当于给他提供了这样一个基础跟最底层的平台,作为他们整个服务的基础存在。


因此需要特别强调的是,作为一项通用化的解决方案,都不是任何场景的真正通用化。特别是针对 ISV,其与微软之间构建的是一座技术桥梁,基于双方的实践和探索,共同优化解决方案能够应对的复杂问题。现场,来自中国的品览科技联合创始人李泽洲在谈及对 Azure AI 解决方案应用时提到了他们的实践。


基于 Azure 上的机器学习、IoT、AKS 服务,品览为汽车制造行业的仓储和物流管理效率提升、自动化等提供了一套解决方案。李泽州介绍说:


Azure 机器学习技术提供了一个很好的、类似于底层任务管道,品览只需要在这个任务管道里定制、开发我们自己的核心算法就可以。但还需要结合我们自身对前期的预处理等方式、图像重建技术、对检测目标进行算法调优、算法框架的优化等,基于双方的共同实践,才能帮助客户能够更好地把这个东西做得非常产品化,提升应用价值和使用效率。


除了制造业外,在雷德蒙德微软园区时,记者一行人同样见证到了 Azure 解决方案在医疗、航空行业场景下的几个有意思的应用场景。例如,结合 HoloLens 的混合现实、Azure 的分析处理、IoT 技术等,有一天你也可能成为一名专业的医生,用技术轻而易举就能检测出人类器官的病灶。



萨提亚曾将 AI 划分了不同的几个层次。底层是简单的模式识别,中间层是感知,最高级的智能就是认知,也是对人类语言的深刻理解。


通过 Build,通过在雷德蒙德微软园区孵化出来的一项项实践,微软或许是在向世人证明一个更更高级的智能,这个智能或许是超越对人类语言的深刻理解,而达到对人类意识甚至高于人类意识的理解、探索。


而怎么诠释高于这个更更高级的智能,可能微软 Build 2020 的大会中,会显露端倪。


2019-05-11 21:3833785
用户头像
Cherry倩芸 InfoQ高级策划编辑

发布了 51 篇内容, 共 23.2 次阅读, 收获喜欢 34 次。

关注

评论

发布
暂无评论
发现更多内容

效果不好,为什么?

矩视智能

深度学习 机器视觉

深度开发者故事|API Explorer 助力教育行业 一站式搭建实验环境

云计算 软件开发 华为云

深入理解 Dubbo 协议的调试方法与实践

Apifox

Java 程序员 dubbo 后端 RPC

全网累计销量TOP 1的TCL超薄嵌入式冰箱,跟着选0出错!

科技热闻

CodeWhisperer 的安装及体验

亚马逊云科技 (Amazon Web Services)

Java Python 人工智能 云上探索实验室 Amazon CodeWhisperer

Docker打包前端vue代码推送镜像到远程仓库

javaNice

Java’ Docker 镜像

可跨平台数据库多连管理工具:Navicat Premium 16 中文版

繁星

数据库管理 Navicat Premium 16

一站式IT统一运维管理平台有哪些?大家都在用哪个?

行云管家

IT运维 运维管理 统一运维

Photoshop 2024 Mac最新资源 附 alpaca增效工具 可完美替代AI创成式填充

加油,小妞!

ps AI绘图 Photoshop 2024

ps插件:Camera Raw for Mac 16.0中文版

加油,小妞!

ps插件 Camera Raw 16

企业数智化领先实践,学得会!

用友BIP

数智化转型

数智化采购平台覆盖间接采购全流程,现金流优化的“小成大就”

用友BIP

数智采购

After Effects 2024 for Mac(ae视频特效制作工具)

展初云

Mac软件 视频编辑 AE After Effects

如何在嵌入式软件开发的过程中使用DevSecOps方法,提升开发效率与安全性

龙智—DevSecOps解决方案

DevOps DevSecOps

在Linux上玩原神!2023-10月武汉Linux爱好者线下沙龙(WHLUG)活动回顾

nn-30

Linux 操作系统 技术沙龙 deepin WHLUG

数智化营销——企业会员私域运营的成功路径

用友BIP

数智营销

KubeEdge-Ianvs v0.2 发布:终身学习支持非结构化场景

华为云开发者联盟

云计算 云原生 后端 华为云 华为云开发者联盟

治理效率提升77%!揭秘基于DataLeap实时健康分的最佳实践

字节跳动数据平台

数据库 数据治理 数据安全 数据研发 企业号11月PK榜

大型企业财务共享建设避坑指南之场景化表单设计

用友BIP

财务共享

生态合作升级!用友Fast by BIP On 阿里云战略发布

用友BIP

「我在淘天做技术」1688的AIGC商业化落地实践探索

阿里技术

创意 校园招聘 1688 B端 AIGC

人民网《外企谈信心》| Denodo:加强数据管理技术合作 护航数字经济高质量发展

科技汇

日常数字生活中,手机里的隐私信息是如何被保护的?

最新动态

组态软件特点及工控组态软件应用

2D3D前端可视化开发

物联网 组态软件 PLC 工业控制系统 web组态编辑器

最常用的4种光纤接口结构有哪些?

小魏写代码

Parallels Desktop 19 虚拟机 一键激活 无需关闭sip

繁星

pd虚拟机 Parallels Desktop 19 pd虚拟机 19

犀牛Rhino 8 for Mac(3D建模软件)

展初云

Mac 建模软件 Rhino 犀牛

使用 Appilot 部署 Llama2,会聊天就行!

SEAL安全

Walrus llama-2 Appilot 企业号11月PK榜

人人用数不用愁,动态数据脱敏为您解忧

华为云开发者联盟

数据库 大数据 华为云 数仓 华为云开发者联盟

Kontakt Factory Library 2(Kontakt原厂音色库)

展初云

Mac软件 音色库 Kontakt

从Build 2019,看微软AI背后的同理心、多元化与对更高智能的探索_语言 & 开发_Cherry倩芸_InfoQ精选文章