本周《人工智能》:微软(Microsoft)将人工智能广告贴在键盘上

电脑作者 / 花爷 / 2025-08-15 00:10
"
      跟上像人工智能这样快速发展的行业是一项艰巨的任务。所以,在人工智能可以为你做这件事之前,这里有一个关于机器学

  

  

  跟上像人工智能这样快速发展的行业是一项艰巨的任务。所以,在人工智能可以为你做这件事之前,这里有一个关于机器学习世界的最新故事的简单总结,以及我们没有单独报道的著名研究和实验。

  本周在人工智能领域,微软发布了一款带有“Copilot”键的新标准PC键盘布局。你没听错——未来,Windows机器将有一个专用键来启动微软的人工智能助手Copilot,取代原来的Control键。

  有人认为,此举意在表明,微软在争夺消费者(以及企业)人工智能主导地位方面的投资是认真的。这是微软近30年来首次改变Windows的键盘布局;配备Copilot键的笔记本电脑和键盘预计最早将于2月底发货。

  但这一切都是虚张声势吗?Windows用户真的想要一个人工智能快捷方式吗?还是微软式的人工智能时代?

  微软无疑给几乎所有新旧产品都注入了“副驾驶”功能。通过华丽的主题演讲、精美的演示,以及现在的人工智能钥匙,该公司正在让其人工智能技术脱颖而出——并押注于此来推动需求。

  需求并不是一个确定的事情。但公平地说。一些供应商已经成功地将病毒式传播的人工智能变成了成功。看看ChatGPT的制造商OpenAI,据报道,到2023年底,该公司的年化收入超过16亿美元。生成艺术平台Midjourney显然也是盈利的,而且还没有接受过一分钱的外部资本。

  不过,我只强调了几个。大多数供应商受到培训和运行尖端人工智能模型的成本拖累,不得不寻求越来越多的资金来维持运营。举个例子,据说Anthropic在本轮融资中筹集了7.5亿美元,这将使其融资总额超过80亿美元。

  微软及其芯片合作伙伴AMD和英特尔希望人工智能处理将越来越多地从昂贵的数据中心转移到本地芯片,在此过程中使人工智能商品化——这很可能是正确的。英特尔的新消费类芯片阵容包含了为运行人工智能而定制设计的核心。此外,像微软自己的新数据中心芯片可以使模型训练比目前更便宜。

  但这并不能保证。真正的考验在于,Windows用户和企业客户在受到相当于Copilot广告的轰炸后,是否会对这项技术表现出兴趣——并为此掏腰包。如果他们不这样做,微软可能要不了多久就不得不再次重新设计Windows键盘了。

  以下是过去几天一些值得注意的人工智能故事:

  Copilot进入移动领域:在更多关于Copilot的新闻中,微软悄悄地将Copilot客户端带到了安卓和iOS,以及ipad上。

  GPT商店:OpenAI宣布计划推出一个gpt、定制应用程序商店基于其文本生成AI模型(例如GPT-4),在下周内完成。GPT商店是在去年OpenAI的第一届年度开发者大会DevDay上宣布的,但推迟到了12月——几乎可以肯定的是,在最初宣布之后的11月,领导层发生了变动。

  OpenAI降低监管风险:OpenAI的其他新闻称,这家初创公司希望通过一家爱尔兰实体将大部分海外业务转移到欧盟,以降低其在欧盟的监管风险。娜塔莎写道,此举将削弱欧盟一些隐私监管机构单方面采取行动的能力。

  训练机器人:布莱恩写道,谷歌的DeepMind机器人团队正在探索如何让机器人更好地理解我们人类到底想从它们身上得到什么。该团队的新系统可以管理一组协同工作的机器人,并建议可以由机器人硬件完成的任务。

  英特尔的新公司:在佛罗里达州博卡拉顿市的支持下,英特尔正在分拆一家新的平台公司Articul8 AIsed资产管理公司和投资者DigitalBridge。正如英特尔发言人所解释的那样,Articul8的平台“提供了将客户数据、培训和推理保持在企业安全范围内的人工智能功能”——这对医疗保健和金融服务等高度监管行业的客户来说是一个很有吸引力的前景。

  黑暗捕鱼业,曝光:卫星图像和机器学习为海运业提供了一个新的、更详细的视角,特别是海上渔船和运输船的数量和活动。结果是道路。全球渔业观察的一个团队和多所合作大学在《自然》杂志上发表的一项新研究揭示了这一事实。

  AI-powered搜索:将人工智能应用于网络搜索的平台Perplexity AI在一轮融资中融资7360万美元,公司估值为5.2亿美元。与交付在其他搜索引擎中,Perplexity提供了一个类似聊天机器人的界面,允许用户用自然语言提问(例如,“我们在睡觉时燃烧卡路里吗?”)。“游客最少的国家是哪个?”等等)。

  临床记录,自动书写;更多资金方面的新闻,巴黎美国初创公司Nabla获得了2400万美元的融资。该公司与美国医疗保健巨头凯撒医疗集团(Kaiser Permanente)旗下的永久医疗集团(Permanente Medical Group)合作,正在为医生和其他临床工作人员开发一种“人工智能副驾驶”,可以自动记笔记和写医疗报告。

  你可能还记得去年各种有趣的工作例子,包括对图像进行微小的更改,导致机器学习模型错误,例如,将狗的照片误认为是汽车的照片。他们通过添加“扰动”,即图像像素的微小变化,以一种只有模型才能感知的模式来做到这一点。或者至少他们认为只有模型才能感知它。

  谷歌深度思维研究人员的一项实验表明,当一张花的图片在人工智能看来更像猫时,人们更有可能将这张照片描述为更像猫,尽管它看起来绝对不像猫。卡车和椅子等其他常见物品也是如此。

  图片来源:Google DeepMind

  为什么?如何?研究人员并不真正知道,参与者都觉得他们只是随机选择(事实上,这种影响虽然可靠,但几乎不高于偶然)。似乎我们只是比自己想象的更有洞察力——但这也对安全和其他措施有影响,因为它表明,潜意识信号确实可以在没有人注意到的情况下通过图像传播。

  本周,麻省理工学院(MIT)进行了另一项涉及人类感知的有趣实验,该实验利用机器学习来帮助阐明一种特定的语言理解系统。基本上,一些简单的句子,如“我走到海滩”,几乎不需要任何脑力来解码,而复杂或令人困惑的句子,如“在其贵族体系中,它影响了一场惨淡的革命”,通过功能磁共振成像(fMRI)可以产生更多更广泛的激活。

  研究小组比较了人类阅读各种句子时的激活读数,以及在一个大型语言模型中,相同的句子如何激活相当于大脑皮层的区域。然后,他们制作了第二个模型来了解这两种激活模式是如何相互对应的。这个模型能够预测新句子是否会对人类认知造成负担。这听起来可能有点神秘,但它绝对是超级有趣的,相信我。

  机器学习能否在更复杂的领域模仿人类的认知,比如与计算机界面的交互,仍然是一个悬而未决的问题。虽然有很多研究,但总是值得一看。本周我们将介绍SeeAct,这是俄亥俄州立大学研究人员开发的一个系统,它的工作原理是将法学硕士对现实世界中可能行为的解释费力地建立在基础上。

  图片来源:俄亥俄州立大学

  基本上,你可以要求像GPT-4V这样的系统在网站上创建一个预订,它会知道它的任务是什么,它需要点击“预订”按钮,但它真的不知道怎么做。通过改进它对带有明确标签和世界知识的界面的感知方式,它可以做得更好,即使它仍然只能在一小部分时间内成功。这些代理模式还有很长的路要走,但预计今年会有很多大索赔!我今天刚听到一些。

  接下来,看看这个有趣的解决方案,它解决了一个我不知道存在的问题,但它非常有意义。自动驾驶船是一个很有前途的自动化领域,但当海洋愤怒时,很难确保它们在轨道上。GPS和陀螺仪不能解决这个问题,而且能见度也可能很差——但更重要的是,控制它们的系统并不太复杂。所以它们可能会偏离目标,或者在不知情的情况下绕路浪费燃料,这在电池供电的情况下是个大问题。我从来没想过这个!

  韩国海事和海洋大学(我今天学到的另一件事)提出了一个更强大的寻径模型,该模型建立在计算流体动力学模型中模拟船舶运动的基础上。他们提出,更好地了解波浪作用及其对船体和推进力的影响,可以大大提高自主海上运输的效率和安全性。它甚至可以用于人类驾驶的船只,因为船长不太确定给定的风暴或波浪形式的最佳攻角是什么!

  最后,如果你想好好回顾一下去年计算机科学的重大进展(到2023年,这些进展将与机器学习研究大量重合),可以看看Quanta的精彩评论。

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读