微软公司首席执行官萨蒂亚‧纳德拉在达沃斯论坛年会上。
“人工智能(AI)技术将彻底改变微软的所有产品。”1月17日,微软公司首席执行官萨蒂亚‧纳德拉(Satya Nadella)在达沃斯论坛年会上表示,该公司计划将ChatGPT等AI工具整合到其所有产品中。
(资料图片仅供参考)
早在纳德拉正式宣布这一战略计划前,就有媒体不断曝出微软的一系列举动:1月4日,消息人士称微软正准备在其必应(Bing)搜索引擎中加入ChatGPT;9日,消息人士称微软正在将OpenAI(ChatGPT的开发者)的人工智能技术纳入其办公软件;10日,报道称微软正就向OpenAI投资100亿美元开展谈判;16日,微软表示将其云服务Azure接入 OpenAI。
通过加码目前最炙手火热的AI公司,微软全面拥抱人工智能的姿态已经非常明显。这会给微软带来一定风险:ChatGPT的准确性还难以保证,且这类人工智能工具会带来高昂的成本。《华尔街日报》分析称,即使是微软恐怕也得面对一种现实:在AI驱动的世界里,跨越一键之距展开竞争的成本相当高,特别是在即便盈利能力强的科技巨头也不得不密切关注净利润之际。
微软为什么要加码OpenAI?
人工智能文本生成工具ChatGPT一经推出便获广泛关注,前所未有地在不到一周时间里就聚集了100万用户,并且不是昙花一现。据全球网站分析工具Similarweb的数据,最近ChatGPT主页的日访问量超过了2000万次——是ChatGPT推出两周后该网站日点击量的近两倍。
“ChatGPT的功能很强大,对于在这个行业的研究人员来说,ChatGPT的水准可谓是相当惊艳了。”北京智源人工智能研究院NLP/多模态模型研究负责人伍昱对澎湃科技(www.thepaper.cn)表示。
1月17日,微软称正迅速采取行动,把OpenAI开发的AI工具纳入自家的产品和服务,其中包括ChatGPT。纳德拉在达沃斯论坛年会上对《华尔街日报》表示:“微软的每个产品都将拥有其中一些相同的AI能力,从而获得彻底改变。”
OpenAI是一家AI研究实验室,由营利性公司OpenAI LP和非营利性母公司OpenAI Inc组成,拥有热门图像创建工具DALL·E等。2015年,OpenAI作为一家非盈利组织成立,目标是以安全的方式实现通用人工智能(AGI),使全人类平等收益,而不是为公司的股东创造利润。但在2019年,OpenAI从非营利组织转变为有“利润上限”的营利组织,并建立了一个独特的结构——投资回报有上限(投资利润不超过投资额的100倍),任何超出的部分都将返还给非营利组织。
2019年,微软对OpenAI投资10亿美元。2022年10月,微软又宣布将把OpenAI的人工智能绘画产品DALL·E 2与微软的多种产品集成,包括新的平面设计应用微软设计(Microsoft Design),以及必应的图像生成器。
根据彭博社汇编的数据,如果此次再向OpenAI投入100亿美元,这笔投资将轻松超过微软迄今为止的任何投资,包括1999年斥资50亿美元购买美国电话电报公司(AT&T)股票以换取新的有线网络接入,以及1997年斥资10亿美元收购康卡斯特公司(Comcast)的股份。
在生成式人工智能突飞猛进的一年后,微软有意加强与OpenAI的合作不足为奇。但这一消息对谷歌来说却是一个不愿见到的动向:ChatGPT等技术的问题回答功能可能威胁到谷歌核心的搜索业务。
2022年11月30日,ChatGPT的推出促使谷歌管理层在内部拉响了“红色警报”。微软是谷歌在网络搜索领域最大的竞争对手,尽管必应在全球网络搜索市场上的份额仍只有个位数百分比。自ChatGPT推出以来,谷歌母公司Alphabet股价已累计下挫近10%,是大型科技股中表现最差的,这相当于同期纳斯达克指数百分比跌幅的三倍。
《福布斯》预测,2023年微软支持的OpenAI和谷歌之间将爆发全面战争。
“一直以来谷歌都是对OpenAI跟的最紧的,OpenAI能拿出的东西,谷歌不出意外在最多3-6个月时间里都能拿出来。Search+Chat(搜索+聊天),谷歌并没有落后多少。”北京智源人工智能研究院研究员曹越对澎湃科技表示。
谷歌也有关于大众行为的数据库,可以用来赚取利益。根据StatCounter的数据,至少从2009年开始,谷歌提供了超过90%的全球互联网搜索服务。即使微软在2009年年中推出了自己的必应搜索工具,也没能真正撼动谷歌的市场份额。
谷歌在ChatGPT问世之前采取的策略是,用聊天机器人的技术来增强搜索引擎的使用体验。在2021年5月的I/O大会上,谷歌就展示了其最新的人工智能系统LaMDA,称其可以使回答更加“合情合理”,让对话更自然地进行。但目前,谷歌仍不愿向公众发布LaMDA,部分原因在乎LaMDA存在较高的误差,且容易对用户造成伤害。
ChatGPT还“不靠谱”
但要将ChatGPT应用于搜索,还有许多问题需要解决。
ChatGPT的运作机制决定了所产生的回答准确性难以保证,信息来源难以回溯。《科学美国人》报道称,资深的科学家也无法准确分辨ChatGPT撰写的科学论文。在一项测试中,专家错误地将32%的生成摘要识别为真实摘要,将14%的真实摘要识别为生成的。
“ChatGPT的预训练依托于大型语料库,而语料库来源于互联网上实际发生的语言使用场景。一方面,这使得其无法避免地带有虚假信息、歧视偏见信息,另一方面,也往往容易忽略冷门信息。”上海人工智能研究院研究员陈逸君对澎湃科技(www.thepaper.cn)表示。
Bernstein分析师马克·什穆利克(Mark Shmulik)在最近的一份报告中说,普通的信息搜索查询和可带来收入的查询之间存在巨大差异,ChatGPT在后者上的劣势是“极其明显的”。
陈逸君认为,对于虚假信息、歧视偏见信息等问题,可以从数据预处理上过滤不良信息,同时在模型中增强对相关信息的检测识别,屏蔽或回避相关问答,这在ChatGPT中已有体现。对于忽略冷门信息,可以在特征工程上加以改进,调整模型在不同信息上的的注意力权重。
对于ChatGPT的内容偏见问题,曹越也表示,“本质上深度学习方法都是拟合数据,偏见本身是存在于数据之中的,如果真的要解决偏见问题,可能还是从数据入手最为合理。”
除了这些问题之外,陈逸君提出,ChatGPT缺乏逻辑推理能力,在需要推论演绎的任务上容易给出荒谬的答案,未来需要在模型中做出改进,使其能在语料的基础上自我推理,达到逻辑完备,甚至超越人类的认知。
人工智能成本高昂
最终,考虑到所需的算力,纳入ChatGPT等AI工具对谷歌和微软来说可能都是成本高昂的。
“通过嵌入(embed)API,错误内容和偏见问题在技术路径上容易解决。真正要解决的是成本问题,以及融合到现有搜索引擎索引方式的工程问题。”清华大学交叉信息研究院助理教授吴翼告诉澎湃科技。
摩根士丹利的分析师布莱恩·诺瓦克(Brian Nowak)估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。如果OpenAI能够获得微软Azure云服务的最低价格区间,这个成本倍数可能会下降到四倍。但即便如此也仍然是一个相当大的差距,反映出微软在将ChatGPT和其他OpenAI工具更进一步嵌入到其产品中时可能承担的成本。
这样的成本压力看起来是不合时宜的。投资者目前更关注谷歌和微软这两家公司的利润,因为预计今年的收入增长将大幅放缓。Alphabet今年的运营利润率预计为27%,比2022年有所下降,但仍比疫情暴发前的3年平均水平高出约五个百分点。与此同时,预计微软的利润率将连续第三年保持在40%以上——这是自1999年以来未曾有过的成就。
这可能解释了为何微软最终选择跟随其他主要科技公司一起裁员。1月19日,微软宣布计划裁员1万人以应对全球经济放缓,裁员人数不到其员工总数的5%,这是该公司八年多来规模最大的一次裁员。许多人预计谷歌母公司Alphabet将很快采取类似行动。
在投资者都想要看到企业减少支出的时候,如何增加开支就成了一个连ChatGPT都无法回答的问题。
OpenAI含金量有多高?
与此同时,微软将赌注压在OpenAI上是否合理?
Semafor的报道称,微软投资100亿美元,是在赌OpenAI将远远领先于其他以ChatGPT类似产品为基础的人工智能公司,但OpenAI很可能会面临来自Stability AI等公司的激烈竞争。目前尚不清楚这批新的人工智能公司将如何建立“护城河”和“网络效应”,如果没有这些,就很难在消费科技领域赚钱。
与OpenAI相似,Stability AI也在2022年异军突起,其AI绘画产品Stable Diffusion,相比订阅制的Midjourney、付费也不一定用得上的DALL·E,凭借稀缺的开源特征早早积累下了相当规模的用户群体,去年10月的估值达10亿美元,成为AIGC(人工智能生成内容)领域的第一家独角兽企业。
在曹越看来,Stability AI和OpenAI可能不是竞争对手。“OpenAI在当前这个时代引领科研和产业界发展,也就是说,‘在GPT-3没有出来之前能够有做出GPT-3的能力’是独一份的。而Stability AI是通过(显)卡的堆积,希望可以迅速跟进OpenAI的最前沿进展,但远未能证明其引领能力。而从商业化的角度讲,OpenAI的每个产品,只要有卡有人,可能都可以迅速复现。”
吴翼也认同Stability AI和OpenAI没有可比性,“Stability AI是个开源合作模式的公司,本身没有核心产品。OpenAI有自己的基础设施和技术团队,本质上是开源和闭源的差异。OpenAI的核心优势是先发并且技术强很多,商业布局也走得更前面。换句话说,Stability AI还需要从商业上证明自己,而OpenAI不需要,OpenAI要证明的是能不能真正实现自己所说的。”
曹越总结称,创造(Create)和复制(Re-produce)是不同的,复制永远只能跟随,而创造才能引领。