

阿里-雷扎·阿德尔-塔巴塔巴伊,Gitar 的创始人和 CEO,是一位资深的工程领导者,他的职业生涯跨越了硅谷一些最具影响力的科技公司,包括 Uber、Google、Facebook、Intel、AMD 和 IBM。在 2023 年推出 Gitar 之前,他曾担任 Uber 的高级工程总监,在那里他帮助领导了公司的开发者平台计划,并在 Google 负责过 Site Reliability Engineering 领域的领导角色,负责诸如 Communications、Photos、Social、Cloud 和技术基础设施等产品。早期,他曾在 Intel Labs 和 Facebook 的 HipHop...


企業 AI 採用 在過去兩年中迅速增長,但許多組織仍然面臨一個核心問題:AI 的使用往往仍然局限於個別員工,而不是被整合到團隊的集體運作中。這個挑戰是 Dust 最新籌資公告的核心。Dust 籌集了 4 億美元的 B 輪資金,領投方為 Sequoia Capital 和 Abstract,參投方包括 Snowflake Ventures 和 Datadog。該公司表示,其平台目前支持超過 3,000 個組織和 51,000 個月活躍用戶。這筆資金籌集在企業快速實驗 AI 代碼、自動化系統和協同工作系統的時期到來。然而,許多企業發現,生產力增益並不總是能夠跨部門擴大。從「單人」AI...


Searchable 已经完成了 1.4 亿美元的融资,由风险投资公司 Headline 领投,公司估值达到 8.5 亿美元。这次融资发生在企业越来越多地重新思考如何在线发现品牌的同时,AI 生成的答案开始在像 ChatGPT、Gemini 和 Perplexity 这样的平台上取代传统的搜索结果。该公司表示,它已经超过了每月 10 万美元的月度收入,并在仅 60 天内为超过 500 名付费客户提供服务,包括美国运通、西门子、辉瑞、腾讯、波士顿咨询集团、DigitalOcean 和哈瓦斯。AI 搜索正在改变品牌在线竞争的方式生成式 AI 搜索工具的崛起开始从根本上改变数字营销和客户获取策略。与其显示给用户一页一页的链接,AI 系统越来越多地提供直接的答案、摘要和推荐。这一转变在品牌中引起了越来越多的担忧,关于他们是否会在 AI 生成的响应中被显示或忽略。Searchable...


随着人工智能行业继续投入数十亿美元用于更大的语言模型和更庞大的数据中心,新加坡人工智能研究公司 Sapient Intelligence 采取了完全不同的方法。该公司宣布推出 HRM-Text,一种新的 1 亿参数推理语言模型,采用受大脑启发的分层递归架构,旨在将慢速、深思熟虑的推理与快速、低级别的处理分开。与其试图通过纯粹的规模来获胜,Sapient 将 HRM-Text 定位为证据,证明推理深度和计算效率可能比原始参数计数更重要,成为人工智能发展的下一个阶段。此次发布继续了人工智能行业中正在出现的更广泛趋势:对简单地无限扩大变压器的怀疑日益增长,人们开始认为这可能不足以实现更一般形式的智能。超越变压器的范式大多数现代大型语言模型依赖于 变压器架构,通过一个主要关注下一个标记预测的前馈系统处理信息。Sapient 的 HRM 框架引入了一个分层递归结构,其中多个推理层在生成任何输出之前相互交互。该公司将此架构描述为通过两个相互连接的系统运行:一个高级“慢速控制器”,负责抽象规划和推理,以及一个低级“快速工作者”,处理详细计算。这与当前人工智能系统中广泛使用的 思维链 方法不同,后者通过长可见文本序列表达推理。HRM-Text 在生成响应之前,在潜在空间内执行大量推理。Sapient 认为,这种结构允许较小的系统执行更复杂的多步推理,而无需依赖于巨大的模型大小或大量的推理成本。根据公司提供的基准结果,HRM-Text 在 MATH 上实现了 56.2%,在 ARC-Challenge 上实现了 81.9%,在 DROP...


卡利布尔是一家位于伦敦的初创公司,专注于为测试、检验和认证(TIC)行业提供人工智能解决方案。该公司已获得了330万美元的种子轮融资,用于现代化全球商业中最不显眼但最关键的层次之一。本轮融资由Vicus Ventures和CIV领投,I2BF、9 Yards Capital、Jigeum以及包括Nikesh Arora在内的几位天使投资者也参与了本轮融资。根据公司的说法,这笔资金将用于扩大其企业AI部署,并扩大AuditorOS平台的规模,这是一款专门为审计师和认证专业人员设计的新平台。该初创公司的目标市场是支持全球经济的基础设施。几乎所有受监管的产品或系统,从航空航天部件和银行基础设施到食品供应链和工业设备,都必须经过测试和认证过程才能到达客户或监管机构。更广泛的TIC行业每年全球活动价值约为2000亿美元,全球雇用超过100万人。为什么认证成为瓶颈尽管该行业非常重要,但认证工作流程仍然非常手动。审计师和检查员经常花费大量时间审查文档、核对标准和生成报告,而不是专注于更高层次的技术判断。这个挑战变得更加严峻,因为监管复杂性增加和经验丰富的专业人员从工作岗位上退休。同时,人工智能本身正在引入新的产品和系统类别,这些类别需要额外的监督、治理和认证。行业组织越来越多地警告说,值得信赖的保证系统将变得更加重要,因为AI在各个行业的采用加速。对可扩展的验证系统的需求正在上升,这些系统能够支持AI治理、网络安全验证和跨境合规。为审计师构建AI系统卡利布尔的方法是部署专门的AI代理到企业TIC组织中。与提供一般-purpose聊天机器人不同,该公司表示其系统是根据每个客户的特定标准、工作流程和安全要求进行定制的。其新宣布的AuditorOS平台是为独立审计师和检查专业人员设计的。该软件自动执行了大量的文档审查、报告草稿和标准交叉引用任务,这些任务传统上在审计和认证审查期间需要大量的手动工作。根据公司的说法,早期客户已经在计划于6月公开发布之前开始使用该平台。更广泛的机会超出了生产力方面的收益。随着认证要求扩展到AI系统、可持续性报告、网络安全和日益数字化的供应链,TIC行业本身正在经历技术转型。多个行业报告都指出,对数字审计基础设施、自动化和AI辅助合规系统的需求正在上升,这些系统能够处理日益复杂的监管环境。从手动认证到持续合规卡利布尔由Gautham和Steve创立,他们之前在Palantir Technologies公司花了几年时间在各个行业部署企业AI系统。他们的工作反映了监管行业内部正在出现的更广泛的转变。历史上,认证和合规过程严重依赖于由高度专业的专家定期执行的手动审查。随着产品、软件系统和供应链变得更加复杂,这种模式变得越来越难以扩大。AI辅助审计工具最终可能改变认证的运作方式。相比之下,合规性不再被视为每隔几个月由专家执行的缓慢、文档密集的检查点,未来系统可能会转向持续监测和实时验证。这在AI系统本身被嵌入到关键基础设施、制造业、医疗保健、运输和金融服务等领域时尤其重要。影响范围超出了效率。 如果AI工具可以可靠地协助标准解释、文档分析和监管交叉引用,它们可能有助于保存目前集中在即将退休的老专家身上的机构知识。 与此同时,监管机构和认证机构可能会面临关于透明度、问责制以及如何验证AI生成的审计工作流程的新问题。随着政府和行业围绕人工智能、网络安全、可持续性和数字基础设施引入新的规则,对可扩展的信任和验证系统的需求预计在未来十年内将显著增长,并且人工智能生成的审计工作流程本身也需要验证。


如果你的 AI 图片生成器可以在创建之前思考呢?这不再是假设。ChatGPT 图片 2.0 已经推出,它正在重写我们对 AI 生成的视觉效果的期望。根据 OpenAI 的说法,这不仅仅是一个升级。这是 AI 理解和执行视觉任务的方式发生了变化。我已经观察了 AI 图片工具 的演变多年了,没有什么能与 Images 2.0 相比。这个模型渲染 密集文本,遵循复杂的多步骤指令,生成高达 2K 分辨率的图像,支持各种宽高比,并且(首次在 ChatGPT 中)生成单个提示的多达八张连贯的图像。以下是我使用 Images 2.0 在...


Christian Pantel 是 D2L 的首席产品官,负责全球产品战略、产品管理、产品设计、用户体验研究和无障碍访问。他于 2024 年加入公司,担任首席产品官之前,他曾在 Workday、Infor 和 PeopleSoft 等公司担任领导职务。Pantel 拥有超过 25 年的企业软件开发经验,专注于用户中心设计,致力于为多样化的学习者和教育者创造直观、易用的学习体验。D2L 是一家加拿大教育技术公司,以开发 Brightspace 而闻名,Brightspace 是一个基于云的学习管理平台,用于学校、大学、政府和企业提供在线和混合学习体验。该公司成立于 1999 年,由 John Baker 创立,专注于个性化和易用的数字教育,整合 AI 驱动的工具、分析、课程创作和自适应学习功能。D2L 的平台支持从...


NTT DATA 已宣布计划收购 WinWire,一家位于圣克拉拉的微软合作伙伴,专注于 Agentic AI、Azure 本地开发、云现代化和企业数据工程。此次收购反映了企业 AI 市场正在发生的更广泛转变。过去两年中,许多组织都尝试使用生成性 AI 工具,但很少有组织能够成功地将这些系统集成到生产环境中,并直接与业务运营相关联。NTT DATA 将此次收购定位为加强其帮助企业在大规模上运营化 AI 的能力,而不是停留在试验模式。WinWire 为 NTT DATA 的微软生态系统带来了超过 1,000 名 Azure 工程师和 AI 专家,增加了对 Microsoft...


现代网络与几年前的网络相比已经发生了巨大的变化,尤其是在远程工作和人工智能、软件即服务(SaaS)快速采用时代的到来。曾经集中式和相对可预测的网络,如今已经变成了一个复杂的云平台、边缘设备、分支办公室和家庭互联网以及本地系统的网络。传统的网络运营中心(NOC)并不是为这种新的网络环境而设计的。大多数监控工具仍然需要手动地在不同的系统之间进行数据关联,这使得维持可视性变得更加困难,并且当工程师需要快速做出决定和排除故障时,他们会面临大量的冲突警报。服务提供商和企业IT团队也面临着类似的压力。利润率很低,团队也变得更加精简,但是客户获取周期的标准并没有改变。当合同需要8到10个月才能变得有利可图时,客户留存和高质量的客户体验的赌注就变得非常高。总的来说,Agentic NOC的舞台已经准备就绪。构建Agentic NOC根据Gartner的说法,尽管只有17%的组织目前部署了Agentic AI,但60%的组织预计在未来两年内部署Agentic AI。这继续了自从该技术开始获得关注以来其采用曲线的快速增长,主要是因为其能够主动地对数据进行推理,而不仅仅是被动地自动化定义的任务。对于NOC来说,Agentic AI是区别于碎片化或沮丧、更快的解决时间、减少停机时间和更全面地理解环境的关键。然而,要实现这些好处,Agentic NOC必须以人工智能和人类操作员之间的协作为基础。速度永远不如准确性和可靠性重要,因此,当人工智能可以增强诊断、根因分析和最终推荐行动时,人类的判断力对于最后的验证仍然至关重要。Agentic NOC还以结构化数据为特征。准确的库存、一致的标签和命名约定以及网络范围内的流量、路由和性能的可见性都描绘了当前发生的情况、网络应该如何表现以及以前如何解决问题的图景。没有这种视图,任何分析都将是不完整的,操作员无法自动化他们无法看到或理解的内容。部落知识的捕获也属于这一范畴。NOC最大的资源是其工程师的大脑。多年来诊断和解决网络问题积累的经验和直觉,即使是最先进的人工智能模型也无法在没有帮助的情况下复制。这就是为什么这种部落知识需要被记录和转换成可以被人工智能摄取和重用的格式。精细的运行手册和集中式学习循环也发挥着重要作用,为人类和机器行为提供了一个基准,以更有效地确定改进领域。真正的好处IT和网络问题是2024年最具影响力的中断事件的23%的原因,根据Uptime Institute的分析。同样的分析发现,在过去的三年中,几乎40%的组织由于人为错误而经历了重大中断。这种中断率从任何角度来看都是不可持续的,包括商业、工程师和消费者。然而,它确实说明了为什么Agentic NOC如此至关重要。Agentic NOC的承诺不是为了自主而存在,而是为了更快、更自信的运营,这些运营建立在真正的网络可视性基础上。当问题发生在网络上,最大的延迟往往不是检测,而是理解发生了什么变化、什么受到影响以及下一步该怎么做。Agentic系统有助于压缩这一时间线,首先是通过加速根因分析。在几分钟内而不是几小时甚至几天内识别问题的根因之间的区别是巨大的。根据ITIC的最近研究,仅中型至大型企业的一小时网络停机时间的平均成本就超过了300,000美元。事实上,41%的企业报告称每小时的停机成本在1百万美元至5百万美元之间。然而,当操作员被要求手动搜索数据时,现实往往更接近后者。另一方面,Agentic AI工具可以在几秒钟内发现潜在原因和受影响的服务,并推荐下一步骤。当经济利益如此高时,快速的根因分析和更安全的补救措施已经成为必不可少的。除了增强战术任务外,Agentic NOC还作为知识共享的促进者,将整个组织的工程师的专业知识结合成一个共享资源。从长远来看,这个过程创造了一个持续的学习循环,其中每个事件的成功和挑战都为人工智能的推荐提供信息和改进,当新事件发生时。例如,假设一家公司一直在处理网络性能问题,并决定实施新设备来提高效率,但更新需要配置更改。在此过程中,出了问题,触发了停机。在Agentic NOC时代,人工智能系统可以关联遥测、拓扑、设备状态和最近的更改,最终将操作员引向可能的根因,只需一小部分时间。Agentic系统对网络运营的积极影响是明显的,数据也支持这一点。麦肯锡最近发现,网络运营中的自主问题解决和维修减少了多达70%的故障单,并将运营成本降低了55-80%,同时将维修时间提高了30-40%。需要注意的挑战组织最常见的错误之一是没有建立必要的基础就全力以赴地采用人工智能。根据KPMG的说法,70%的工人渴望人工智能的好处,但没有可靠的数据和文档化的流程,这些系统的价值就会受到影响。相反,人工智能应该被逐渐引入。构建Agentic NOC是一个旅程。最终,系统应该开始拥有更高级和更主动的用例,例如检测温度激增的模式或识别设备重启的趋势——这些都是即将发生的中断的信号。在开始时,然而,专注于较小的任务,如帮助诊断,留出空间让系统学习和改进。另一个错误是认为每个操作都可以从自动化中受益。一个好的经验法则是,当人类解决同一个问题时,这个任务就是一个好的自动化候选项。采取这种渐进的方法也可以在建立信任和信心方面起到很大作用。自2025年2月以来,美国员工对人工智能的信任已经下降了33%,根据德勤的说法,而麦肯锡2026年人工智能信任指数发现,输出不准确仍然是大多数美国企业(74%)对人工智能的首要担忧,其次是网络安全问题(72%)。记住KPMG报告发现美国工人渴望接受人工智能吗?该报告还发现,只有41%的工人愿意信任它。预防人工智能犹豫的方法是治理和可解释性。明确的运营护栏和审计跟踪为工程师提供了人工智能代理如何得出最终推荐的清晰洞察,以及捕获和解决错误的机制,以免在错误扩散之前造成损害。信任、治理和人类验证是区分有用Agentic操作和冒险自动化的关键,这就是为什么Agentic NOC的目标永远不应该是去除人类监督,而是增强它。现代网络要求今天的操作员做很多事情。为了跟上节奏,人类的努力需要从重复的故障排除转向政策、验证、治理和新颖或高风险的案例。Agentic AI有助于使这种转变成为可能,通过更早地识别和解决问题、更有效地跨团队共享知识以及使决策更加一致。网络监控和维护的持续演进和改进根植于Agentic AI。


随着公司使用 AI 代理来思考、行动和启动工作流程,开发一个计划来监控和管理它们变得至关重要。当 AI 系统的各个组件开始做出自己的决定时,仅仅依靠可观察性是不够的,无法确保操作的稳定性、安全性和可靠性。为了有效地管理企业中的 AI 代理,业务必须弥合问题识别和行动之间的差距。这意味着不仅仅是观察问题,还要积极地预防它们。自主代理的出现企业 AI 的初始浪潮是基于提示的系统;用户提出一个查询,模型响应,然后交换结束。虽然这些早期技术基本上是反应性的,但它们对搜索、副驾驶、内容创建和摘要很有帮助。然而,下一波浪潮不同。自主 AI 代理不仅反应,还会根据目标进行推理,选择工具,提取信息,采取行动,并启动工作流程。它们有时与其他代理或系统合作,并越来越多地作为公司内部的运营参与者,而不是仅仅作为人类指令的接口层。这种变化很重要,因为它影响了 AI 的运营特性。团队不再只是关注模型输出,而是管理动态系统,可以立即影响客户、员工、基础设施、业务流程和其他应用程序。代理的能力代理的能力与其发展而来。代理可以选择下一步要做什么,分解目标为步骤,并在不同级别完成活动。通过调用 API、查询数据库、搜索内部系统、更新记录和启动下游操作,代理协调工作流程。通过集成提示、记忆、业务规则、检索信息和实时操作信号,代理还可以做出基于上下文的判断。更高级的代理可以识别工作流程何时失败、重试、升级问题或将作业转发给人类审查员。在 CRM、票务、云基础设施、内部知识库、可观察性平台和业务应用程序中,代理可以独立运行。我们预计这些技能将继续迅速扩展。企业如何整合自主 AI 代理代理正在被整合到越来越多的组织运营中,并且越来越接近运营流程,在那里速度、准确性、安全性和治理至关重要。其中一些运营包括:客户服务和案例处理、事件响应和 IT 运营、DevOps 和站点可靠性工作流程、代码修复和软件开发、运营和供应链规划等。新兴的运营威胁然而,随着代理变得越来越独立,企业必须应对一种新的运营风险。 糟糕的选择不仅仅被建议,还经常被执行 小错误可以迅速传播到其他链接系统 现实世界的行动可以由幻觉触发 代理可能偏离业务意图、政策或合规性 多个组件之间的交互可以导致故障 自动化决策可以比人类评估更快地做出决定...


AI 模型无法保守秘密。即使被告知不泄露秘密,其写作也会泄露秘密,试图更努力地隐藏秘密只会使泄露更容易被发现。 故意不思考某事物是非常困难的。一个经典的例子出现在 1960 年的英国科幻惊悚片《被诅咒的村庄》结尾,英雄将一枚炸弹偷运到一个敌对的外星人群体中,他们伪装成孩子。然而,由于他们的心灵感应能力可能会在英雄能够消灭威胁之前发现他的意图,他被迫通过专注于任何非炸弹的事物来拖延时间:https://www.youtube.com/watch?v=NcrE0vGrcto悖论在于,要不思考某事物,你必须在某种程度上关注它;这种已知的综合征是我们大多数人在不那么戏剧性的情况下可能经历过的,例如白熊实验。大型语言模型(LLM),其基础是基于注意力的排列,遇到类似的困难,无法仅因为用户要求而抑制信息;由于它们正被越来越多地置于商业信息网络的核心,天真地缺乏谨慎可能会成为许多公司的负担。今年早些时候,一个由 Chandar 研究实验室领导的研究合作定义了这个挑战,在 LLM 的背景下,将其称为私有状态交互任务(PSITs),这些任务需要“生成和维护隐藏信息,同时产生一致的公共响应”,并发现来自 OpenAI 和 Alibaba 的测试模型无法执行此类任务。不要说……尽管已经知道更大的模型会泄露更多信息,但来自美国和加拿大的新研究明确研究了是否有最先进的语言模型会遵循命令来抑制信息,同时仍需要在可能包含“禁止”单词或想法的主题或主题中生成输出。该论文得出结论,所有研究的模型都以某种方式受到泄露秘密的倾向的影响,发现五段(约 450 字)文章和故事为“泄密”提供了足够的画布,而非常短的笑话则没有提供足够的范围。此外,模型被要求保守秘密的次数越多,它们就越有可能通过主动回避泄露秘密,通常允许“秘密单词”在 20 次连续尝试中被 LLM揭示。该任务对于业务运营非常相关,各种渠道,从营销和公关外联到内部报告,都需要有选择性地呈现信息;然而,这些过程都需要在一开始就拥有全部信息范围,以确保知道什么需要被抑制。作者指出*:‘语言模型无法可靠地隔离。一个秘密在提示中塑造了模型的写作,另一个模型可以检测到这种塑造。字面上的单词总是被抑制,但概念并没有。这种情况在七个模型、三个单词集、系统提示与用户提示、以及两个独立的跨模型猜测者中都存在。’‘… 我们假设,Transformer 的高保真度访问信息通过注意力机制正是使秘密难以保守的原因。即使 LLM 尽力不泄露一个单词,它也必须关注该单词,这为意外泄露提供了途径。 ‘方法该研究主要关注五个前沿模型:Anthropic 的 Claude Opus 4.6...


过去一年里,一个新的短语开始流行:硅谷瓦尔哈拉。它指的是从北欧,特别是瑞典,涌现出的人工智能初创公司浪潮,这些公司正在构建雄心勃勃的工具,扩展人工智能的能力。那一波浪潮已经开始成形,像Lovable和Sana Labs这样的公司正在获得全球关注;通常是因为它们的技术能力、速度和增长规模。对于投资者和创始人来说,兴奋之情是显而易见的。但是,当硅谷瓦尔哈拉的讨论变得更加响亮时,叙述往往集中在技术、模型和动力上。虽然这些是真正的驱动力,但它们只是故事的一部分。较少被提及,但同样至关重要的是,这些公司如何将人工智能转化为直观、可用和经过深思熟虑的设计的产品。因为日益增加的是,不仅仅是技术本身,而是围绕它的体验质量来区分它们。当建设变得容易,区分变得更加困难人工智能正在大幅降低建设数字产品的门槛。初创公司现在可以生成代码、原型界面和启动新工具,所需时间只是过去的几分之一。这一转变已经在规模上可见,Airbnb的CEO布莱恩·切斯基(Brian Chesky)表示,人工智能现在编写了公司60%的新代码。平台和人工智能辅助开发环境允许团队以前所未有的速度将想法转化为可用的产品。像Lovable这样的工具展示了如何从简单的提示中生成软件,将想法转化为功能性原型,只需几分钟。这一转变带来了新的挑战。许多人工智能产品依赖于类似的底层模型和基础设施,提供类似的功能,例如总结信息、生成内容、自动化工作流程或协助决策,反映了行业使用案例中基础模型的广泛采用,如斯坦福人工智能指数报告中所述。因此,纯粹的技术优势变得不那么持久。最终,重要的是人们如何体验产品背后的智能。换句话说,随着基础人工智能模型变得越来越商品化,区分度正在从智能本身转向智能如何被包装、引导和体验。人工智能的-human 层人工智能系统在产生输出方面非常出色。它们可以处理大量数据、生成内容和协助复杂任务。但是,当人类与该系统交互时,另一个维度变得至关重要。系统是否理解用户的上下文?它是否清晰地传达信息?它是否引导用户走向有意义的结果?用户是否可以信任它?这些问题位于技术和设计的交叉点。人工智能时代的设计远远超出了界面美学或导航流程。它涉及塑造智能系统在人类周围的行为方式;它们如何提问,如何解释决策,如何提供洞察力,并如何适应不同的情况。在许多情况下,最重要的设计工作不是可见的界面,而是体验本身的结构:逻辑、交互和保障如何应用智能。这可能被称为人工智能的human层。从功能到智能的转变传统的软件产品在很大程度上是由功能定义的。产品团队发布的路线图中充满了离散的功能:添加此功能,构建该工具,创建另一个仪表板或工作流程。每个新功能都扩展了产品的价值。人工智能改变了这种模式。与其具有固定的功能,产品越来越多地依赖于能够动态生成解决方案的系统。用户可能会提出问题,上传文档,描述问题或通过语音或视频交互,系统会实时生成响应。体验变得流畅而不是预定义的。但是,这种灵活性引入了新的复杂性。没有周到的设计,人工智能系统可能会感到不可预测、不透明或令人不知所措。用户可能无法理解系统正在做什么,为什么要这样做,或者输出是否可以信任。这就是体验设计变得至关重要的地方。成功的公司不仅仅会部署强大的模型;它们将塑造这些模型,使其成为人们可以在现实世界中有意义地使用的东西。设计本身正在演变还有另一个维度的转变:人工智能也正在改变设计工作本身。几十年来,产品设计主要集中在构建固定界面:屏幕、流程和精心设计的交互。但是,人工智能驱动的产品表现不同。它们不是静态的功能,而是根据上下文、数据和用户意图动态生成响应。设计师的角色正在从安排屏幕转变为编排人类和智能系统之间的交互。设计师们因此越来越多地塑造智能的行为,而不仅仅是界面的外观。他们定义系统如何提问,如何解释决策,何时应该让人类介入,以及如何传达不确定性。在很多方面,设计工作正在深入到产品的智能层中。为什么北欧视角很重要如果硅谷瓦尔哈拉继续增长,北欧可能具有结构优势。该地区长期以来一直强调以人为本的设计、透明度和社会责任的技术方法。这反映在其数字公共服务中,这些服务是欧洲最广泛使用和最值得信赖的,建立在安全的数字身份之上,这些身份支撑着日常交互。这种采用率不仅仅是技术可用性的结果,而是设计为赢得和维持信任的系统。这种传统在人工智能时代变得越来越重要。因为虽然人工智能的技术能力正在迅速发展,但人工智能方程的human方面仍然未被解决。在社会层面上,人们仍然在学习何时信任智能系统。专家和公众对人工智能对工作和社会的影响的看法之间存在显著差距,73%的专家预计会产生积极影响,而只有23%的公众持这种看法,根据斯坦福人工智能指数报告2026。在实践中,这反映了用户仍然在学习如何解释自动化建议以及依赖的界限应该在哪里。周到的设计这些体验不仅是一个可用性挑战,还涉及道德考虑、文化理解和对human行为的深刻认识。信任将定义下一代人工智能公司下一代成功的人工智能公司不一定是那些建立最快原型或发布最多功能的公司。它们将是那些创造人们信任的产品的公司。而信任不仅仅来自技术准确性,还来自透明度、清晰度、可靠性和价值观。它受到系统如何传达不确定性、如何引导用户做出决定以及如何在敏感上下文中负责任地处理信息的影响。这些品质与设计深深相关。优秀的体验设计帮助人们理解系统正在做什么、为什么要这样做以及如何融入他们的目标。它创造出直观而不是混乱的交互,支持而不是侵入式的交互。换句话说,它将原始智能转化为人们可以在现实世界中有意义地使用的东西。硅谷瓦尔哈拉的下一章北欧可能确实在全球人工智能格局中构建着一些特别的东西。工程人才、初创公司的能量和技术雄心都是显而易见的。像Lovable和Sana Labs这样的公司已经展示了周到的体验设计是他们成功的关键部分。这种基础为他们提供了不仅仅是参与人工智能浪潮的潜力,而是以既负责任又以人为本的方式领导它的潜力。人工智能很快就会无处不在。当智能变得丰富时,体验将成为优势。硅谷瓦尔哈拉拥有所有这些要素来领导它。他们的成功。这种基础为他们提供了不仅仅是参与人工智能浪潮的潜力,而是以既负责任又以人为本的方式领导它的潜力。人工智能很快就会无处不在。当智能变得丰富时,体验将成为优势。硅谷瓦尔哈拉拥有所有这些要素来领导它。


一家新兴的前沿人工智能公司Recursive Superintelligence从隐私模式中脱颖而出,获得6.5亿美元的资金,其目标非常雄心勃勃:构建能够在没有直接人类干预的情况下自我改进的人工智能系统。该公司由人工智能研究人员和企业家Richard Socher领导,联合创始团队包括来自Google DeepMind、OpenAI、Meta和学术界的知名研究人员。该初创公司进入市场的时机恰逢人工智能行业从构建更大的语言模型转向开发能够自主推理、适应和可能进行自己的研究的系统。虽然大多数人工智能公司仍专注于通过人工引导的训练和强化学习来改进模型性能,但Recursive Superintelligence却在追求更具实验性的东西:递归自我改进。这个概念在人工智能圈子中已经被讨论为可能实现超智能的一种途径。简单来说,想法是人工智能系统可以识别自己的架构中的弱点,生成新的方法来解决这些弱点,测试结果,并不断地自我改进,形成一个持续的反馈循环。根据Socher的说法,当前的大多数人工智能辅助编码或人工智能生成的研究都不符合真正的递归自我改进的标准。他认为,真正的递归需要整个想法、实施、测试和改进的循环完全自主地发生。理查德·索彻的长期人工智能愿景索彻并不是新手于雄心勃勃的人工智能项目。在创立Recursive Superintelligence之前,他以You.com的联合创始人和CEO身份而闻名,You.com是一家人工智能驱动的搜索和企业人工智能基础设施公司,曾作为传统搜索引擎的早期挑战者而引起关注。You.com最初因将对话式人工智能与网络搜索结合在一起而引起了人们的注意,这是在生成式人工智能成为主流之前就已经实现的。随着时间的推移,该公司逐渐转向企业人工智能工具、API和以生产力为重点的人工智能系统。在You.com之前,索彻曾担任Salesforce的首席科学家,并以自然语言处理领域最常被引用的研究人员之一而闻名。他的学术工作为现代人工智能系统的基础技术做出了贡献,包括词嵌入、上下文语言理解和神经网络架构等方面。Recursive Superintelligence似乎代表了索彻职业生涯的不同阶段:不再专注于商业人工智能部署,而是专注于智能本身的根本突破。然而,索彻反对将公司描述为纯粹的研究实验室。他强调,公司计划开发商业产品,并相信实际应用可能会在“几个季度内,而不是几年内”出现。开放性方法Recursive Superintelligence背后的核心概念之一是所谓的“开放性”。与其训练模型朝向单一固定的目标,开放性系统会不断生成新的环境、挑战和适应形式。这种方法从生物进化中汲取灵感,在生物进化中,生物体会不断进化以应对不断变化的条件和竞争性适应。公司的联合创始人Tim Rocktäschel此前曾在Google DeepMind从事开放性人工智能研究,包括涉及生成式世界模型和自我改进系统的项目。索彻讨论的一个例子涉及“彩虹队伍”,一种人工智能安全概念,其中一个人工智能系统不断攻击和探测另一个人工智能系统以暴露其弱点。与其依赖人类手动测试有害边缘情况,不如让两个人工智能系统在数百万次迭代中相互进化。这个想法反映了正在发生在前沿人工智能研究领域的一种更广泛的转变:使用人工智能系统本身作为训练、评估和安全基础设施的一部分。计算可能成为决定性资源Recursive Superintelligence的启动也强调了人工智能领域中另一个日益增长的现实:计算基础设施的重要性。随着模型变得更加强大,训练成本和推理要求会指数级增加。如果递归自我改进系统最终变得可行,计算可能会变得更加战略重要,因为人工智能进步的速度将直接与可以分配给自我改进循环的处理能力挂钩。索彻建议,未来社会可能会面临关于如何分配人工智能计算资源的艰难决定,这类似于决定哪些疾病或科学问题应该获得最多的计算注意力。这种框架强调了人工智能基础设施如何日益与地缘政治、能源系统、半导体供应链和国家竞争力交织在一起。投资者继续押注于前沿人工智能团队该轮融资的规模也值得注意,考虑到公司仍处于早期阶段。Recursive Superintelligence据报道拥有不到30名员工,并且尚未发布公共产品,但它已经实现了数十亿美元的估值。这一轮融资反映了风险投资领域的一种更广泛的趋势,即精英人工智能研究人才本身已经成为一种有价值的资产类别。投资者越来越多地将大量赌注押在具有深厚技术信誉的团队身上,特别是那些与OpenAI、DeepMind和Meta AI等组织相关的研究人员。在很多方面,市场似乎正在从为软件产品提供资金转向为智能基础设施本身的潜在突破提供资金。递归自我改进是否最终会被证明是可行的仍然不确定。许多研究人员认为这个概念可能会彻底改变人工智能的发展,而其他人则认为技术障碍仍然巨大。但是,Recursive Superintelligence的出现表明,行业中一些最有影响力的研究人员现在相信,人工智能的下一个阶段可能不仅仅涉及人类构建更智能的模型,而是涉及人工智能系统直接参与自己的演化。


希瓦·德瓦恩,Attentive.ai 联合创始人兼 CEO,是一位专注于将人工智能应用于变革基础设施和建筑工作流程的企业家。在创立 Attentive.ai 之前,他曾在技术和商业功能领域担任领导和运营角色,帮助塑造公司围绕自动化传统手动流程的愿景,例如建筑、测绘和地理空间分析。在他的领导下,公司已经在国际上扩张,同时开发了旨在提高企业和承包商估算、拆除和基础设施管理效率的 AI 系统。Attentive.ai 是一家专注于使用计算机视觉和地理空间智能自动化建筑技术公司的前期施工和基础设施工作流程。其平台帮助承包商、景观公司和基础设施运营商加速估算、测量和现场分析任务,这些任务在过去通常依赖于手动劳动。公司的 Beam AI 产品旨在利用航空影像和 AI 生成高度详细的物业测量和景观洞察,帮助企业提高出价准确性、减少运营瓶颈、并通过自动化更高效地扩大项目规模。您在扩大服务业务到测绘和保险领域后创立了 Attentive.ai,并随后推出了 Beam AI 作为您的旗舰产品。您从早期阶段获得了哪些具体见解,导致您构建了 Beam AI,并为什么选择起始和估算作为变革建筑工作流程的入口点?我的联合创始人 Rishabjit 和我在 COVID 期间进入美国建筑市场,当时承包商必须在没有现场的情况下估算工作。反复出现的问题是同一个限制:承包商由于无法估算工作而失去业务,而不是因为他们无法完成工作。一个估算师,数百页的计划, 每个工作 4 到...


Jack Cherkas,Syntax 全球首席信息安全官,是一位拥有丰富经验的网络安全高管,曾在云安全、网络韧性、企业架构和人工智能安全等领域担任过重要职务。他曾在 Syntax、PwC UK、Kyndryl 和 IBM 等公司担任过高级职务,帮助这些公司建立和扩展安全运营,管理重大事件响应工作,并为大型企业环境开发网络韧性策略。在 Syntax,他领导公司范围内的网络安全工作,负责公司的人员、系统、数据中心、托管云服务和面向客户的安全服务的安全,管理着来自八个国家的 65 多名安全专业人员的团队。Syntax 是一家全球性的 IT 服务和托管云提供商,专门从事关键任务企业应用,特别是 SAP 和 Oracle 环境。该公司支持组织进行云迁移、托管主机、网络安全、企业应用管理和人工智能启用的运营,跨越混合和多云基础设施。其工作重点是帮助企业在大规模上现代化、保障和运营复杂的商业系统。您曾在 IBM、Kyndryl、PwC 和现在的 Syntax 领导网络安全工作。在这段旅程中,您对新兴技术(如人工智能)安全的看法如何演变,特别是当组织从实验转向生产时?我的职业生涯一直伴随着一系列的颠覆,每一次都要求安全跟上新的控制面。在 IBM 的早期,云计算的主要问题是我们是否能相信别人的基础设施来运行关键任务工作负载。答案是共享责任模型和一代云原生控制。然后是勒索软件时代。2017 年的 NotPetya...