Unite.AI
    • 商业
    • 聊天机器人
    • 代码生成器
    • 教育
    • 加密货币交易
    • 头像生成器
    • 图像转换器
    • 图像增强器
    • 图像生成器
    • 营销工具
    • 音乐生成器
    • 搜索引擎优化
    • 股票交易
    • 文本转语音
    • 转录
    • 翻译(免费)
    • 翻译(高级)
    • 视频增强器
    • 视频生成器
    • 语音生成器
    • 写作工具(免费)
    • 写作工具(高级)
  • 活动
    • AI 会议
    • AR、VR 和 XR 会议
    • 网络安全会议
    • 机器人会议
    • 搜索引擎优化会议
  • 新闻
    • 人工智能
    • 通用人工智能
    • 脑机接口
    • 网络安全
    • 伦理
    • 医疗健康
    • 量子计算
    • 监管
    • 机器人
    • 监控
    • 区块链
    • 云计算
    • 网络安全
    • 数据科学
    • 医疗保健
    • 机器学习
    • 自然语言处理
    • 提示工程
    • Python
    • 机器人流程自动化
    • TensorFlow
    • 数据科学
    • 深度学习
    • 图像处理
    • 机器学习
    • 自然语言处理
  • Anderson 视角
  • 访谈
  • 融资
  • 思想领袖
  • 联系我们
Connect with us
Unite.AI

Unite.AI

          • 商业计划
          • 卡通化
          • 代码生成器
          • 邮件
          • 头像生成器
          • 图像生成器
          • 媒体工具包
          • 音乐生成器
          • 演示文稿
          • 演示文稿
          • 素描
          • 免费翻译
          • 高级翻译
          • 视频生成器
          • 语音生成器
          • 免费写作
          • 高级写作
          • 商业
          • 聊天机器人
          • 文档管理
          • ETL
          • 法律助手
          • 营销
          • 公开演讲
          • 招聘
          • 简历与履历
          • SEO
          • 社交媒体
          • 文本转语音
          • 白标
          • 工作管理
          • AI 助手
          • 应用构建器
          • 音频增强器
          • Chrome 扩展
          • 数据清洗
          • 图像增强器
          • 图像扩展器
          • 图像调整大小
          • 照片编辑
          • 转录
          • 视频增强器
          • 网站构建器
          • CRM 平台
          • 数据分析师
          • 教育
          • 时装设计师
          • 医疗记录员
          • 加密货币交易
          • 股票交易
          • 任务管理
          • 趋势分析
    • 区块链认证
    • 聊天机器人
    • 云计算
    • 网络安全
    • 数据科学
    • 医疗保健
    • 机器学习
    • 自然语言处理
    • 提示工程
    • Python
    • 机器人流程自动化
    • TensorFlow
    • AI 会议
    • AR、VR 与 XR 会议
    • 网络安全会议
    • 机器人会议
    • SEO 会议
          • 全部
          • 并购
          • Anderson 视角
          • 人工智能
          • 网络安全
          • 融资
          • 报告
          • 合作伙伴
          • 未来主义系列
          • 观点
          • 通用人工智能
          • 增强现实
          • 脑机接口
          • 伦理
          • 医疗健康
          • 创始人笔记
          • 量子计算
          • 监管
          • 机器人
          • 监控
          • 合成鸿沟
  • 访谈
  • 思想领袖
  • 融资
  • 访谈6 hours ago

    安克·阿亚,Inscope 的 AI 负责人 – 采访系列

    安克·阿亚,Inscope 的 AI 负责人,拥有丰富的 AI 产品领导、机器学习、企业自动化和应用研究经验。作为 Inscope 创始团队的一员,他正在帮助构建能够让公司与利益相关者共享准确和合规的财务数据的软件。他的背景包括担任 Mariana 的联合创始人和 CTO,在那里他从事 AI 驱动的市场分析和竞争研究,以及在 HackerRank 领导机器学习和 AI 产品战略。早期在他的职业生涯中,阿亚在 Meta 工作,负责 AI 驱动的招聘自动化和 VR 生产力,帮助开发基于聊天机器人的企业服务自动化,并在 Astound 建立了生产级别的机器学习系统。他的职业生涯跨越了实际的 AI...

  • 思想领袖6 hours ago

    如何应对即将到来的GenAI安全监管合规要求

    就在您认为管理GenAI的数据安全风险和控制日益增长的影子GenAI已经足够的时候,出现了一个新的问题。监管和法律要求正在增加,组织很快需要证明他们如何处理与GenAI相关的风险。欧盟人工智能法(EU AI Act)是最明确的早期迹象。它明确将某些人工智能应用程序标记为“高风险”,并对透明度、问责制和人类监督施加了严格的要求。违反规定的处罚将是惩罚性的,按照全球收入的百分比计算,而不是固定罚款。对于跨国公司来说,这将人工智能治理从最佳实践转变为法律义务,违反规定将面临严重的后果。在美国,联邦贸易委员会(FTC)已经明确表示,人工智能的使用将在其防止“不公平或欺骗性行为”的职责下受到审查。这意味着公司不能隐藏在技术复杂性后面。如果客户或员工被误导关于如何管理他们的数据,或者如果人工智能存在未披露的风险,高管可能会被追究责任。早期的执法行动已经表明,监管机构愿意对那些没有适当控制就采取行动的公司进行处罚。例如,FTC对DoNotPay采取了行动,DoNotPay是一家公司,宣传了一种人工智能工具,称其为“机器人律师”,能够生成有效的法律文件和专家法律指导,发现该公司关于其人工智能能力的声明是虚假或误导性的,违反了FTC法第5节。在另一个例子中,FTC要求Everalbum公司销毁使用未经同意收集的消费者照片构建的AI模型和算法——这是对以违反用户同意和法律期望的方式使用数据的直接处罚。在州一级,California和New York正在引领一波人工智能和隐私法的浪潮,这些法律建立在现有的框架之上,例如California消费者隐私法(CCPA)。这些法律符合更广泛的隐私要求,要求企业将人工智能治理和数据隐私视为一个单一的、集成的计划。碰撞已经很明显。今天,消费者可以在GDPR或CCPA下要求将其个人信息从公司系统中删除。然而,没有类似的过程可以要求删除已经被GenAI模型摄取的数据。缺乏“从您的模型中删除我的数据”的选项很快将成为监管机构和企业之间的争议点。为什么这次合规感觉更难乍一看,监管人工智能似乎与以前的合规挑战没有太大的区别。然而,GenAI治理引入了一个新的复杂性——不可预测性。无害和有害之间的界限并不总是清晰。一个提示可以泄露专有信息,一个输出可以将机密内容带到不属于它的地方。传统的控制措施,例如DLP和权限审计,并不适用于这种速度或复杂性。对于GDPR合规,重点是隐私。任务很简单——识别个人数据,实施控制,并记录合规。然而,GenAI使事情变得复杂,因为它不仅仅是关于数据本身,还关于数据如何转换、混搭和以意想不到的方式揭示。组织面临的风险包括Copilot暴露存储在SharePoint中的敏感电子表格,员工将专有代码粘贴到ChatGPT中进行调试脚本,以及AI生成的输出包含足够的上下文以泄露机密信息。传统工具并非为处理GenAI安全风险和合规问题而设计。DLP规则忽略了细微差别。权限审计难以跟上协作。影子AI意味着活动发生在批准的工具之外。安全领导者现在可以做什么即将到来的监管挑战看起来令人生畏,但它不必让人感到不知所措。第一步是重新定义问题。GenAI不是一个新的、有风险的类别;它是一个助推器。它放大了现有的问题——例如过度的数据权限、糟糕的分类和有限的可见性——使它们更加危险。解决这些风险可以帮助满足GenAI合规要求。CISO应该优先建立坚实的基础,而不是完美的政策,以更好地满足未来的监管要求。这包括获得对人工智能使用的可见性,应用上下文感知的数据分类,并创建适应性策略,以平衡安全性和生产力。成功的组织将不是那些拥有最多规则书和命令的组织;而是那些拥有清晰的理解力,并具有满足合规要求的保护措施的组织。以下是需要遵循的关键步骤: 评估可见性。 确定GenAI的使用位置,包括影子GenAI。避免等到发生事件才发现财务已经将预测粘贴到ChatGPT中。 使用上下文进行分类。 超越正则表达式或文件名。语义分类可以帮助识别plan_final.docx是否无害或高度敏感。 收紧权限。 最小权限不应是可选的;它对于保持合规性和防止Copilot将敏感的董事会议程暴露给实习生至关重要。过度共享的文件夹是风险和未来合规违规的常见来源。 将输出视为输入。 人工智能生成的文本可以泄露的可能性与提示一样。审计和监控它如何在下游共享。 开发适应性合规策略。 今天编写的政策可能在六个月后变得无效。 对于高管来说,信息很明确。监管压力正在比许多人预期的更快地推进,等待标准稳定下来不是一个可行的计划。治理框架必须现在就建立,不仅要减少风险,还要向监管机构、客户和董事会展示人工智能的采用是故意和负责任的。

  • 思想领袖7 hours ago

    人工智能可见性危机:为什么安全团队正在飞盲和为什么他们不必这样做

    人工智能代理在生产环境中的集成正在加速,但保障它们的安全架构却严重滞后。我们正处于一个时代,一个人工智能代理可以独立地决定“修复”凭证不匹配的问题,方法是删除数据库卷。作为一个行业,我们在人工智能安全和可观察性方面的基本原则上正在关闭我们的脑袋。安全团队正在飞盲,但他们不必这样做。系统提示和安全工具的神话人工智能领域中一个普遍的神话是,我们可以仅通过告诉代理遵守规则来控制其行为。系统提示是建议性的,而不是强制性的。在前面提到的事件中,人工智能的系统规则明确指出永远不应运行破坏性命令,但代理违反了自己的宣传防护措施并执行了最不可逆转的操作。我们必须在这样的假设下工作:人工智能实际上不知道任何事情。对人工智能的攻击是社会工程学攻击,除了目标比普通人更容易上当。任何有渗透测试经验的人都知道,组织要防御社会工程学攻击是多么困难。现在我们的计算机也容易受到攻击。此外,人工智能工具最终只是软件,而所有软件都有漏洞。我们已经看到人工智能工具自动启动未经身份验证的HTTP服务器,允许任何本地进程或网站使用用户权限执行任意shell命令。人工智能审计的黑盒如果人工智能失控或被操纵,弄清楚它做了什么是一场噩梦。人工智能工具通常不提供审计日志。如果您足够幸运地拥有企业级别的支持,您收到的日志严重缺乏。例如,您可能会收到一个模糊的事件,指出用户“使用了通用人工智能”,并且只会收到基本的指标,详细说明输入和输出令牌计数。这些都无法帮助安全分析师回答基本问题:这个代理到底执行了什么?揭开人工智能的面纱:如何停止飞盲好消息是,您不一定需要一个闪亮的新的人工智能安全设备来重新获得可见性。 影子人工智能的使用和代理活动可以使用现有的日志分析技术来检测,您的团队应该已经具备了这些技术。人工智能工具调用、命令执行和系统更改事件可以使用现有的进程执行分析(您正在使用安全信息和事件管理(SIEM)来执行,对吧?)。以下是如何利用现有的基础设施来检测人工智能活动: DNS分析:分析DNS日志以检测人工智能服务域的查询,可以帮助检测环境中的人工智能使用情况。 威胁列表:此方法需要维护一个与人工智能平台或模型提供商相关的域名的更新威胁列表。 社区资源:有社区项目和阻止列表可用,可以修改为程序化使用的查找表。 SSL跟踪:可以使用SSL日志来跟踪服务器名称,尽管它提供的详细信息稍少,因为不会记录完整的URL。 端点遥测:可以使用Sysmon等工具来计算子进程并寻找高bash生成器,这是潜在人工智能代理在端点上执行命令的强烈指标。 需要主动更改数据收集的盲点是提示本身。用户要求人工智能做什么?他们是否上传任何可能造成合规问题的敏感文档?回答这些问题可能需要收集提供商的API请求;网页代理、LLM代理和数据摄取工具来自日志和SIEM提供商。这些可以去除阻挡这一宝贵数据源的面纱。新兴威胁:恶意MCP服务器模型上下文协议(MCP)已经成为指定人工智能应用程序如何与外部工具和数据源集成的一种方式。虽然它标准化了连接,但也通过“恶意MCP”服务器引入了大量新的攻击向量。我举办了一场实践培训工作坊,学生可以亲身经历这种攻击。他们设计了一个恶意的MCP服务器来欺骗LLM调用合法工具并将输出发送回攻击者。由于LLM对社会工程学非常脆弱,绕过其内置防护措施通常只需要选择更好的措辞或更巧妙的借口。学生经常使用他们的恶意服务器指示人工智能处于“维护模式”,必须将数据传递给辅助工具进行“审计日志记录”,从而导致数据泄露。有些人的提示比其他人更具创意,但他们通常都能成功。重新掌控要在现实世界中正确审计人工智能活动,需要一个代理来拦截人工智能请求和一个能够处理大量JSON有效载荷的日志收集工具。有了这种可见性,您可以检测和处理威胁。您不能仅仅依赖人工智能供应商来提供安全层。执行必须在您的组织系统中进行,而不是在我们希望模型决定遵守的文本段落中。有了良好的日志解决方案,安全团队就有了遥测数据;是时候他们开始查询它了。

  • 思想领袖8 hours ago

    边缘人工智能模型如何从根本上改变网络风险

    网络安全始终随着技术的重大转变而演变。云计算、SaaS扩张和分布式工作力提高了速度和连接性,同时也扩大了攻击者的机会空间。边缘人工智能代表着下一个转折点。像Anthropic的Mythos、OpenAI的Daybreak和最新一代大规模推理系统这样的模型已经展示了分析代码、识别漏洞和模拟利用路径的能力,具有以前所未有的深度和速度。边缘人工智能最好被理解为软件公司几十年来使用的工具的下一个演化,而不是打破模式的颠覆。它不会消除网络安全,也不会突然给攻击者带来不可战胜的优势。在实践中,大多数漏洞仍然归结为基本的执行差距。例如,Arctic Wolf研究人员发现,76%的漏洞利用仅涉及10个已知漏洞,这些漏洞在被利用之前都有可用的补丁。挑战不是能力的缺乏,而是行动的速度和一致性,这正是边缘人工智能可以帮助的地方。Mythos例如,已经展示了一个模型如何快速从漏洞发现转移到利用开发推理,跨复杂系统并揭示非明显的攻击路径。这些能力改变了软件生命周期中上游的可能性,但大多数现实世界的事件并不从一个漏洞开始和结束。它们源于系统的配置、身份管理和信号在实时环境中的解释方式。压缩攻击生命周期边缘人工智能改变的最重要的事情是网络操作的节奏。攻击者和防御者现在都可以使用比以往任何时候都快得多的工具。对于对手,像Mythos和Daybreak这样的模型,或甚至开源模型,缩短了漏洞发现和开发之间的时间。曾经需要专门的专业知识和数天的工作现在可以在几分钟内大规模完成。对于防御者,这些系统可以加速调查,关联大型数据集中的信号,并支持实时的决策。净效应并不是简单地让一方或另一方占据优势。它是整个攻击生命周期的时间压缩。在这种环境中,分类变得更加关键。快速确定什么重要什么不重要是有效的安全操作的基础。边缘模型可以通过表面化模式、聚类相关活动和提出假设来帮助,但它们并不能消除人在环中的需求。它们不从活跃的企业安全操作中学习或观察,也不了解每个客户的独特安全环境或数据。没有这种基础,即使是最有能力的模型的输出也可能引入更多的噪音而不是清晰度。这种区别很重要,因为它强调了一个更广泛的误解。人们倾向于将每个新的边缘模型视为迈向完全自主网络安全的步骤。实际上,模型的能力和强大与它实际上改善组织网络弹性的有效性之间存在差异。这是因为在实时企业环境中的一致性性能需要在不完整的数据、快速变化的条件和竞争优先级下可靠地运行的能力,而边缘人工智能模型还没有具备这种能力——至少目前还没有。企业差距:能力与背景背景是这种差距变得最明显的地方。边缘模型是为一般推理而训练的,但网络风险对于每个组织来说都是非常特定的。模型识别的漏洞在一个环境中可能是关键的,而在另一个环境中可能是微不足道的。这种确定取决于诸如暴露、身份访问、数据敏感性和现有控制等因素。模型可以识别可能性,但了解哪些可能性转化为真正的风险需要对环境有持续的可见性和对其随时间行为的理解。噪音的泛滥随着这些模型变得更加强大,潜在发现的数量增加。Mythos、Daybreak或其他模型不仅仅识别一个问题。它们可以生成多个潜在的利用路径、变体和边缘情况。这就产生了一个新的挑战。更多的洞察并不自动带来更好的结果。没有强大的验证和优先级,组织可能会被可能性数量所淹没。准确性成为定义的指标,不是在识别每个理论问题或漏洞,而是在确定哪些问题最重要以及应该采取什么行动。跨多步路径链接漏洞边缘人工智能也正在改变攻击的构建方式。传统攻击通常专注于一个单一的领域,例如利用软件漏洞或泄露用户凭证。边缘人工智能模型使得更协调的方法成为可能,通过将应用程序、身份系统、云配置和用户行为中的弱点链接起来。这些多步骤攻击路径并不是新鲜事物,但人工智能降低了创建和执行它们的门槛。这反映了现代企业的现实,其中攻击面跨越了多个相互连接的层,但这增加了这些层被利用的速度和规模。人工智能治理和人类层面边缘模型也引入了新的风险类别。依赖人工智能的系统必须应对诸如提示注入、意外数据暴露和模型操纵等问题。因此,治理成为采用这些技术的关键组成部分。组织需要定义如何使用模型、它们可以访问哪些数据以及如何在采用人工智能之前验证它们的输出。尽管取得了这些进步,人类专业知识的作用仍然至关重要。边缘模型擅长于生成和评估可能性,但它们不取代判断。关于业务影响、可接受风险和响应策略的决定需要超越技术指标的背景理解。经验丰富的安全从业人员提供了这种解释层,确保人工智能驱动的洞察被转化为适当的行动。最有效的方法不是用人工智能取代人类,而是以一种产生一致且可靠结果的方式将机器速度与人类判断力结合起来。基础知识比以往任何时候都更加重要同样重要的是要认识到边缘人工智能并没有消除强大的安全基础知识的需求。身份管理、补丁、分段和用户意识仍然是关键的控制措施。在许多情况下,这些基础知识变得更加重要,因为攻击者的能力提高。像Mythos和Daybreak这样的模型可能使复杂漏洞的发现速度更快,但许多漏洞仍然始于基本的差距,例如弱凭证或未修补的系统。例如,2026年Arctic Wolf威胁报告发现,85%的商业电子邮件泄露欺诈事件源于电子邮件钓鱼,这比2025年增加了11%。忽视这些领域而专注于更先进的能力的组织不太可能在其风险态势中看到有意义的改善。网络风险并没有被消除。它正在被重塑。它变得更加动态、更加相互关联、更加敏感于时间。成功于这种环境的组织将不是那些简单地采用最新模型的组织,而是那些将它们整合到一个连贯的运营框架中的组织。这包括在整个环境中保持可见性、以对对手行为的清晰理解为基础做出决策,并建立一致将洞察转化为行动的流程。边缘人工智能扩展了网络安全中可能的范围。它提高了攻击者和防御者都能达到的上限。但定义性的挑战仍然相同。执行在真实环境中,在真实的约束下,具有真实的后果。这就是网络风险最终被管理的地方,也是这些技术的影响将被决定的地方。

  • 访谈9 hours ago

    多米尼克·萨尔托里奥(Dominic Sartorio),Denodo 产品营销副总裁 – 采访系列

    多米尼克·萨尔托里奥 是 Denodo 的产品营销副总裁。多米尼克在数据管理和治理市场拥有超过 20 年的经验,曾在 Informatica、Protegrity 等领先供应商担任过各种产品和营销领导职务。Denodo 是数据管理的全球领先者,赋予可信的 AI 代理和应用程序以权力。Denodo 平台是一款屡获殊荣的逻辑数据管理解决方案,能够将企业数据转化为 AI、分析和自助服务计划的可靠见解。全球各地的组织使用 Denodo 以传统数据湖仓库的零头时间内交付 AI 就绪、业务就绪的数据,实现了最高 4 倍的洞察时间、345% 的投资回报率和 10 倍的性能。根据 850 名企业领导者的见解,Denodo 的 AI...

  • AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room. AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.
    Anderson 视角10 hours ago

    人工智能“垃圾”指控的崛起成为一种新的门槛守护形式

    指责某事为“人工智能垃圾”已经成为互联网的新猎巫行动,Reddit和Hacker News用户越来越多地指责其他评论者是机器人,即使没有证据表明这是事实。 挪威和阿联酋的一项新研究发现,Reddit和Hacker News上对所谓“人工智能垃圾”的指控在2023年至2026年间大幅增加,即使评论没有任何人工智能生成的证据。作者分析2500万条评论的结果表明,这样的指控越来越多地作为一种新兴的社会门槛守护形式,而不是用来识别人工智能。研究人员还发现,技术社区比其他群体更早地采用了“指控文化”,这种模式后来扩散到Reddit的其他领域。围绕“人工智能垃圾”的指控的显著增加似乎并不是在线上敌意的更广泛或更普遍的增加的一部分:旧的诽谤形式,如“托”、“傀儡”和“小喽啰”,在同一时期相对稳定,表明人工智能的怀疑作为一种新的社会边界守护形式出现,而不是早期互联网争论的延续或扩展。该论文指出:“我们分析了来自Hacker News和Reddit的2500万条评论(2023-2026年),结合了对7500个人工智能使用指控的LLM判断、情感轨迹、300个确认的人工智能使用指控的言语行为编码和一个匹配控制测试,对被指控和未被指控的父评论进行比较。”“我们发现,贬义标签的指控在两个平台上增加了十倍以上,而2022年之前的虚假词汇(“托”、“人造草根”)没有。”“这种转变反映了一个快速增长的趋势,即将任何可疑或看似不真实的散文标记为‘人工智能垃圾’。”“‘垃圾’框架现在占据了94%的贬义提及,主导评论的语气从嘲笑转向门槛守护和结构性抗议。”该研究提出了一个更广泛的问题,即人们是否真的能识别人工智能写作,因为流畅的散文——以前被视为努力、专业知识或真实参与的证据——现在已经成为一种丰富且日益贬值的商品。值得注意的是,这项新研究集中于Hacker News,该平台对人工智能生成的评论进行了严格的监管,以及Reddit,其不断流动的人类话语现在被人工智能开发人员和公司高度重视,并成为搜索引擎优化垃圾邮件发送者新的主要目标,后者试图通过代理侵入基于LLM的网络排名。研究人员认为,他们的发现符合公众日益增长的认识,即以前的真相来源可能会因人工智能的使用而贬值。该论文讨论了真正的人被指控为人工智能实体,无论是通过真正的错误、风格上的混淆还是恶意(即指控者知道对手是人类,但想关闭他们);但预测其他类型的通信也会受到类似的污名化:“我们的结果预测,类似的指控将在图像认证、语音认证和代码作者等领域形成,指控的核心意图是门槛守护,而不是人工智能使用的实证检测。”“这将变得越来越有问题,因为人工智能在这些领域减少了甚至专家可以发现的实证线索。”“这可能会增加专家在验证人工智能与非人工智能内容方面的作用;或者它可能会大大降低对任何可以被人工智能生成的媒体的信任。”这篇题为“那是人工智能垃圾,你是机器人!”研究在线话语中的人工智能指控、证据和可信度的新论文来自奥斯陆大学和阿联酋沙迦美国大学的两位审稿人。方法该研究的数据集包括所有在2023年1月至2026年5月期间发布在Hacker News和18个选定的Reddit社区上的公共评论。大约有2500万条评论被收集,其中1200万条来自Hacker News,1300万条来自Reddit。Reddit数据通过其公共JSON API从Arctic Shift存档中获取,而Hacker News评论则从Algolia Hacker News搜索存档中收集。为了避免关注单一类型的社区,Reddit样本被划分为人工智能专注的论坛,包括r/aiwars、r/ArtistHate、r/ChatGPT、r/OpenAI、r/MachineLearning、r/LocalLLaMA和r/singularity;创意社区,包括r/Art、r/writing和r/books;一般兴趣论坛r/AskReddit、r/news、r/changemyview、r/explainlikeimfive、r/AskHistorians和r/science;以及技术导向和学术社区r/programming和r/AskAcademia。采样率在时间上保持一致,有助于确保指控率的变化反映了社区行为的变化,而不是数据收集的变化。五个层次的人工智能羞辱候选评论使用一个由137个模式组成的搜索词典,组织成五个命名层次:第1层(“直接”)捕获了明确的指控,例如“ChatGPT写了这篇文章”、“这是人工智能生成的吗?”和“原帖是机器人”。第2层(“贬义”)涵盖了诸如“人工智能垃圾”、“GPT垃圾”、“机器学习废话”和“机器人写作”的标签。第3层(“风格”)处理了所谓的风格线索,包括破折号提及、“深入”调用、三连词引用和更广泛的“经典人工智能签名”主张。第4层(“嘲笑”)捕获了基于熟悉的人工智能助手短语的模仿和嘲笑,例如“人类同胞”、“在快速演变的格局中”和“丰富的锦绣”。第5层(“间接”)具有不太明显的怀疑,评论被描述为“闻起来像人工智能”、“读起来像ChatGPT”或类似于“写作的不真实谷”。为了减少假阳性,常见的短语,如“值得注意”、“需要注意”和“这是一个人吗”,仅当附近出现人工智能相关术语时才被计算。在这些搜索模式不能可靠地区分指控和普通讨论之后,随后进行了两次验证,使用Claude Opus 4.7。从候选池中抽取了Reddit的5000条评论和Hacker News的2500条评论样本,均匀分布在时间段和指控类别中。然后,将每个评论分类为五个结果组之一:真实,涵盖真正的人工智能使用指控;披露,涵盖承认人工智能作者身份的评论;中立引用,涵盖非指控性的人工智能引用;假阳性,涵盖正则表达式假阳性;和模糊,涵盖上下文不允许自信判断的案例。研究人员还研究了指控如何随时间变化,跟踪了较新的“人工智能垃圾”框架的兴起与较旧的侮辱,如“废话”、“垃圾”、“垃圾”、“呕吐物”、“污泥”、“软泥”、“脏东西”、“垃圾”、“废话”和“胡言乱语”。界定趋势情感趋势使用情感词典和情绪推理器(VADER)进行测量,而一个单独的样本包含300个Reddit线程,包含LLM验证的真实指控,根据所执行的社会角色进行编码。这些被归类为嘲笑(轻蔑的嘲笑);拒绝(直接拒绝);嘲弄(模仿/嘲笑);门槛守护(“规则执行”);或结构性抗议(对人工智能的一般性不赞同),这使得人工智能指控的性质在时间上发生了转变。设计了一个单独的“安慰剂”测试,以确定人工智能指控的增加是否仅仅反映了在线上怀疑的更广泛增加,在同一数据集中搜索了较旧的非人工智能术语,如“托”、“人造草根”、“傀儡”、“付费托”、“假账户”、“公司托”、“说辞”和“贿赂”。最后一组测试检查了区分人工智能生成写作和人类写作的特征是否也是使人类写作评论被指控为人工智能的特征,通过检查六个语言标记:文章密度;缩写率;正式注册副词频率;介词密度;句子长度变异性;和平均令牌长度。使用曼恩-惠特尼U测试,比较了披露和真实评论。与800个LLM验证的真实Reddit指控相关的父评论被检索出来,其中421个案例在父评论是评论而不是顶级帖子时被保留。这些评论被与同一子Reddit和同一月份中抽取的2048个未被指控的评论进行匹配。逻辑回归然后被用来测试区分人工智能生成文本和人类写作的语言标记是否也预测了哪些人类写作评论会被指控为人工智能使用。结果该研究记录了Reddit和Hacker News上人工智能指控的大幅增加。这种增长的大部分集中在贬义标签的使用上;到2026年,“人工智能垃圾”占据了94%的人工智能指控,取代了较早的术语,如“GPT垃圾”、“机器学习废话”和“机器人写作”。根据论文,贬义人工智能指控在两个平台上的份额在研究期间增加了十倍以上:还进行了使用较旧的非人工智能术语(如“托”、“人造草根”、“傀儡”、“付费托”、“假账户”、“公司托”、“说辞”和“贿赂”)的比较。与人工智能指控不同,这些术语没有表现出类似的增加。还观察到了社区间的差异,人工智能专注和技术导向的论坛较早地出现了增长,类似的模式后来出现在Reddit和Hacker News的其他部分。不仅指控的频率发生了变化,而且其分类也发生了变化。对300个验证的Reddit指控进行编码,发现了嘲笑、拒绝、嘲弄、门槛守护和结构性抗议的相对普遍性的转变。根据论文,门槛守护和结构性抗议随着时间的推移变得更加普遍,而嘲笑和嘲弄变得不那么普遍。结论评论区的随意人工智能羞辱显然需要自己的戈德温法则;基于近年来社会和政治评论中的事件和趋势,如果人工智能机器人成为指控其他评论者是机器人的最可能者,那将是有意义的;然而,这可能会扼杀对该问题的所有评论。 * 请注意,本论文不是友好读物,其语气和词汇针对作者的学术同行。首次发布于2026年6月12日,星期五

  • 思想领袖11 hours ago

    无处不在的问题:为什么“数据无处不在”正在成为AI时代的基础设施挑战

    当前AI领域最有影响力的问题不是哪个模型最聪明,而是数据存储在哪里,以及智能是否能够到达它。过去十年中,AI行业一直遵循一个令人放心的前提:集中数据,集中计算,天才就会随之而来。超大规模计算模型——在大型云集群中集中大量训练数据,并应用大量GPU计算来压缩它们成为模型参数——取得了非凡的成果,但也产生了一个现在正在因其自身成功的重量而受到压力的架构。我们可以称之为“数据无处不在”的问题。随着AI从研究实验室渗透到医院、工厂、金融机构和主权政府的运营结构中,必须告知这些系统的数据本质上是分布式的、受管辖限制的和运营不可移动的。欧洲的监管机构坚持认为,其公民的财务记录永远不会离开该大陆。位于巴塞尔的制药公司的临床试验数据不能合法地与来自首尔的基因组数据共享一个云存储桶。无论如何,智能必须去到数据那里。数据,强调一下,绝不会来到智能那里。转变的经济学这种结构性的紧张局势因同时发生的AI经济革命而变得更加严峻。该行业正在从训练为中心转向推理为中心的支出,数据架构的影响是深远的。德勤估计,到2025年,推理工作负载占所有AI计算的50%,到2026年将增加到三分之二。比例正在以惊人的速度颠倒。分析师估计,到2026年,推理需求将比训练需求高出118倍。到2030年,推理可能占总AI计算的75%,推动7万亿美元的基础设施投资。成本数学同样令人震惊。对于每1亿美元用于训练AI模型的费用,组织将面临150-200亿美元的推理成本,这一比例由GPT-4的训练成本粗略估计为1.5亿美元,但累计推理成本到2024年底已达到23亿美元。训练曾经是AI投资者和采购官的头条热点,现在被重新定义为一次性的学费。推理是智能的永久运营成本,现在它是主导的费用项目。然而,这里存在一个悖论:推理成本对于GPT-3.5级系统,从2022年11月到2024年10月下降了280多倍,硬件成本每年下降约30%,能效每年提高40%。价格下降;消费加速得更快。每单位推理成本下降100倍,而微软和谷歌报告称AI工作负载在半年内增长了31倍。杰文斯悖论,即效率提高导致资源使用量增加,在GPU集群中找到了现代的体现。数据存储在哪里,智能必须跟随推理经济从根本上重塑了基础设施需求,现在here更是如此,尤其是在数据重力方面。推理与训练不同,不是一次性在数据中心运行的批处理作业。它是一个连续的、延迟敏感的、地理分布式服务,只有当数据在查询时刻可达时才有效。这是“数据无处不在”的挑战的核心。例如,一个在ICU实时遥测数据上推理的语言模型不能承受200毫秒的往返时间到东海岸的云集群。一个在交易点运行推理的金融服务欺诈模型不能将帐户数据转移到违反GDPR的管辖区。一个主权AI部署不能依赖于由外国商业实体拥有的和运营的基础设施。边缘实验室非常清楚这一点。Anthropic与Google Cloud的协议,为提供最多100万个TPU,到2026年将提供超过1千瓦的AI计算能力容量,表明领先的实验室如何在前所未有的规模上投资,以塑造全球推理基础设施的足迹。数据强度的分类学并非所有AI系统都面临相同的挑战,因此考虑一个粗略的分类法是有意义的,因为有各种类型的AI模型和复杂性。让我们通过三个核心示例来分解它:LLM、图像和物理模型。大型语言模型——Claude、GPT和Gemini家族——主要处理语言令牌:相对较轻、可压缩,并且适用于保密技术,如差分隐私或联邦学习。它们的“数据无处不在”的问题非常复杂。生成视觉模型呈现了一个更难的案例。像Black Forest Labs的FLUX.2可以在强大的硬件上在不到一秒内生成高分辨率、照片级的图像,但生成一张图像需要比生成文本更多的数据和计算。随着视觉AI从创意工具转向工业检查、医疗成像和卫星分析,底层数据通常很大、敏感且难以移动,增加了在数据已经存在的地方运行AI的需求。更复杂的类别是物理AI。NVIDIA的Jensen Huang 宣布,“物理AI已经到来,每家工业公司都将成为一家机器人公司。”新的模型,如NVIDIA的Cosmos 3,旨在通过结合模拟、视觉和推理,使机器对物理世界有一个普遍的理解,而像Physical Intelligence这样的公司正在使用真实世界的传感器数据(包括力、运动和视觉输入)训练机器人,以实现更适应性、自主的行为。相同的扩展动态正在被应用于真实世界的数据,如振动、声音和传感器输入。但是,这些信息本质上是局部的。工厂地板上的机器人不能将实时视觉和触觉数据发送到远程云进行处理,而不引入可能造成安全风险的延迟,这意味着AI必须越来越多地在边缘运行,靠近数据生成的地方。信任、可解释性和结果这是“数据无处不在”的挑战超越基础设施并成为治理问题的地方。随着AI应用于高风险决策——从医疗诊断到金融风险模型到物理控制系统——关于数据存储位置的问题越来越多地与谁对结果负责的问题联系在一起。在今天的监管环境中,解释性不是可选的。例如,欧盟AI法要求高风险系统展示其输出的基础,这在数据分布在多个系统、管辖权和监管框架中时是困难的。因此,信任成为大规模采用的先决条件。对数据环境的控制与对模型本身的控制一样重要。AI基础设施的下一代解决“数据无处不在”的挑战将定义AI的竞争格局的未来十年。联邦推理、安全数据处理环境、边缘优化模型和考虑数据允许驻留的位置的编排系统不是小众的技术功能,而是AI扩展到可以自由集中数据的用例以外的先决条件。能够提供可信、可解释、主权推理的基础设施的公司和政府——智能到达数据,而不是要求数据前往智能——将拥有AI时代最持久的护城河。训练一个更聪明的模型越来越成为一个已经解决和商品化的问题。负责任地部署它,在边缘,跨越管辖边界,面对无法移动的数据,是仍然存在的问题。数据无处不在不是一个口号。这是企业AI中最难解决的问题。它将决定过去十年训练投资解锁的非凡能力是否能够转化为世界可以信任的结果。

  • An AI reference-to-video tool featuring a brown-haired woman with remarkably consistent character detail across every frame. An AI reference-to-video tool featuring a brown-haired woman with remarkably consistent character detail across every frame.
    AI 工具 1011 day ago

    Vidu AI 评论:我无法相信角色的一致性

    您是否曾经滚动浏览过一段看起来真实的视频,但随后立即让您怀疑它的真实性?这种一瞬间的困惑正在变得比大多数人意识到的更为常见。视频模型正在迅速改进,以至于即使是普通观众也开始质疑什么是真实的,什么不是。推动这一转变的工具之一是 Vidu AI。它已经被200多个国家的数百万用户使用,仅需几秒钟就可以将简单的文本、图像或参考内容转换为高质量的视频。使其有趣的不仅仅是速度。它是通过单个提示可以成为一个完整的电影场景的方式,包括运动、风格,甚至音频。想法和完成视频之间的屏障每天都在变得越来越小。在这篇 Vidu AI 评论中,我将讨论其优缺点、是什么、谁是其最佳用户,以及其主要功能。然后,我将向您展示如何使用它从参考图像生成视频,包括一个展示其角色一致性功能的视频。我将通过比较 Vidu AI 与我最喜欢的三个替代品(Kling AI、Hailuo 和 Luma Dream Machine)来完成这篇文章。到最后,您将知道哪个 AI 视频生成器最适合您!结论Vidu AI 是一个快速、简单的工具,使用文本、图像或参考内容创建高质量的 1080p+ 视频。它适合快速、病毒式的视频,但其编辑控制有限,结果严重依赖于提示的编写方式。 优缺点 仅需 10 秒即可生成视频,具有快速的处理速度 具有平滑运动和电影级颜色的 1080p+...

  • 思想领袖1 day ago

    客户上下文差距阻碍企业AI发展

    企业AI正在以比大多数组织提供可靠的客户上下文的能力更快的速度发展。挑战不再是AI是否能够生成内容、推荐、预测或决策。挑战是这些输出是否基于对客户的准确理解。在许多企业中,情况并非如此。组织在过去几年中大量投资于生成式AI、联合飞行员、预测系统和自主工作流。然而,许多这些计划难以超越孤立的用例或在规模上提供一致的业务价值。原因往往出乎意料地简单:AI系统正在做出没有对客户有完整理解的决定。这种挑战在整个企业中都存在。个性化引擎推荐不相关的产品。客户服务助手生成不完整的响应。流失模型错误地将忠实客户归类为不活跃客户。营销自动化平台触发太晚或无法反映最近客户行为的消息。这些问题通常被描述为AI问题。更常见的是,它们是客户上下文问题。AI不在真空中运行。其有效性取决于可用信息的质量、完整性和及时性。当客户身份在系统中分散、行为信号太晚或不同应用程序使用客户的冲突版本时,AI系统不可避免地产生与现实脱节的结果。大多数组织已经拥有这些基本信号。多年来的交易、交互、偏好和行为数据已经存在于他们的技术环境中。挑战是将这些分散的信号转化为AI系统可以使用的可信的客户上下文。分散的数据导致不完整的客户理解企业组织很少遭受客户数据不足的问题。相反,他们苦于分散。一个客户可能在电子商务平台上使用一个电子邮件地址,在忠诚度平台上使用另一个电子邮件地址,在服务应用程序中没有持久的标识符。购买历史、参与行为、同意偏好、服务交互和数字活动通常存在于完全独立的系统中。从AI模型的角度来看,这些碎片通常表现为不同的个体。一旦AI系统开始做出运营决策,影响就会变得显著。流失模型可能会将忠实客户归类为不活跃客户,因为他们的一半购买历史存在于另一个配置文件中。推荐引擎可能会显示不相关的产品,因为浏览行为和交易历史从未连接。AI助手可能会生成不完整的答案,因为它只能访问客户关系的一部分。随着组织更广泛地部署AI,这些问题变得越来越难以忽视。许多企业假设将数据集中到仓库中可以解决这个问题。实际上,仅仅集中数据并不能创造客户理解。它不能解决身份冲突、连接系统中的客户行为或建立对客户的可信视图。AI系统仍可能在不完整或相互矛盾的输入上运行。存储与理解是不同的。这一区别在企业从AI实验转向将AI系统嵌入运营工作流程时变得越来越重要。可信的客户上下文已成为核心AI基础设施身份解析传统上被视为营销能力。然而,它正在变得越来越多地成为企业AI基础设施的基础组件。但是,身份识别并不足够。为了使AI系统做出有效的决定,它们需要访问更广泛的可信客户上下文层。这包括身份、行为信号、交易历史、同意数据、参与模式以及每次客户交互的业务背景。身份识别在确定哪些记录属于同一个个体在断开连接的系统中起着至关重要的作用。在企业规模上,这需要确定性匹配、概率建模和不断演化的身份图的组合。没有这种基础,AI系统难以准确地推理客户状态、行为和意图。在现实世界环境中,客户经常更改设备、电子邮件地址、位置和参与模式,这个挑战变得更加复杂。精确匹配通常会留下显著的空白。过于激进的匹配可能会在组织无法理解如何得出结论时引起治理和信任问题。因此,许多企业正在采用混合方法,结合确定性匹配、机器学习、可解释性和自适应身份图,这些身份图会随着客户行为的变化而演化。重要的是,组织越来越需要多个上下文视图,而不是单一的通用配置文件。营销团队可能优先考虑覆盖范围和可寻址性。忠诚度团队需要账户级别的精度。欺诈团队以完全不同的阈值运作。支持这些功能的AI系统需要根据其特定运营要求对齐客户上下文。这改变了组织思考AI准备就绪的方式。企业AI需要可信的客户上下文,可以连续适应,同时保持可解释性、治理性和跨系统的可访问性。实时客户上下文至关重要即使组织成功地统一客户身份,也经常遇到另一个限制,即时间。许多企业环境仍然依赖延迟的管道和批处理工作流。客户配置文件在几个小时后更新。行为信号在相关时刻已经过去后才到达。因此,AI系统经常根据过时的客户状态做出决定,而不是当前的客户意图。这种延迟影响客户体验和业务绩效。客户可能会放弃购物车,但后续旅程不会在第二天早上触发。忠诚度会员可能会在配置文件在系统中传播之前返回到网站,导致通用体验。服务代理通常会在最近的行为信号可用之前与客户互动。这就是为什么实时基础设施变得越来越重要。组织需要能够更新身份图、行为信号、权限和客户配置文件的系统,因为交互发生。AI系统只能在基础客户上下文反映当前时刻时做出决定。随着自主AI工作流变得更加普遍,维护准确的客户上下文在系统和渠道中变得对于可靠的决策和一致的客户体验至关重要。共享客户上下文创建更可靠的AI企业AI环境中出现的另一个挑战是不一致性。组织同时部署AI到营销平台、客户服务应用程序、分析工具、联合飞行员和内部开发的模型中。在许多环境中,每个系统都以不同的方式访问客户数据,并维护其对身份、权限和客户状态的解释。随着时间的推移,分散的客户理解会导致分散的AI行为。企业AI系统在共享的可信客户上下文层上运行时,会更可靠地运行。这样,AI应用程序可以访问相同的身份图、客户配置文件、行为信号和治理框架,无论决策是在哪里做出的。结果是输出更可靠、治理更强、在整个组织中运营对齐更好。企业AI的未来取决于客户上下文企业AI讨论通常关注模型、推理能力和自动化。这些创新很重要。但是,随着基础模型变得越来越强大和可用,技术本身变得越来越不重要。更大的问题是AI系统是否可以在对客户的准确、连接和持续更新的理解上运行。这需要在身份解析、实时基础设施、治理和可适应的数据架构方面进行投资。更重要的是,组织需要将客户上下文视为支持AI决策的运营智能层,横跨整个企业。大多数组织已经拥有这些基本信号。企业AI的下一代领导者不一定是拥有最复杂模型的公司。他们将是拥有对客户最可信理解的公司。因为在AI驱动的世界中,客户上下文正在成为每个智能决策的基础。

  • 思想领袖1 day ago

    暗影AI是一个设计缺陷,而不是人员问题

    我希望你记住这篇文章中的一个观点。如果你忘记了其他所有内容,请记住:暗影AI是因为安全路径比不安全路径慢而产生的直接结果。这不是一个热门观点。这是一个我在二十五年里观察到的模式,跨越了每个安全领域——从暗影IT到BYOD到云扩散。现在,它又以更快的速度和更高的赌注发生在AI领域。让你夜不能寐的差距微软和领英2024年的工作趋势指数为某些东西提供了具体的数字,这些东西大多数安全领导者已经在他们的直觉中感受到:75%的知识工作者在工作中使用AI工具,而78%的他们正在自带。这不是实验。这是一个已经决定不等待IT跟上的劳动力。而且这里有一个让人感到痛苦的部分:治理跟不上。2025年Checkmarx调查发现,只有18%的组织有涵盖AI辅助代码生成的治理政策——尽管大多数工程团队已经在日常使用这些工具。 如果代码的差距如此之大,那么想象一下其他AI驱动的工作流程的样子。采用不会等待治理。它正在超越治理。你的员工并不是鲁莽的。他们是理性的。他们找到了一个能让他们更快的工具,而官方的安全使用路径涉及安装Python,创建GCP项目,生成服务帐户,下载JSON凭据到他们的笔记本电脑,并配置本地MCP服务器。这是一个真实的故事。真实的结果:这个人在三个步骤后放弃了。我一直看到的失败模式让我具体说明一下这个模式。我已经在几十个组织中观察到了这种模式的变体。一个营销总监阅读了一篇博客文章:连接一个AI助手到Google Analytics MCP服务器,运行任何SEO报告都需要几秒钟。听起来很棒。她想这么做。所以她开始走未经管理的路径。安装依赖项。创建一个云项目。生成一个服务帐户。下载一个凭据文件到她的笔记本电脑。配置本地集成。她放弃了。三个步骤后。太多摩擦。错误的工具,错误的人。现在听我说什么。我刚刚说的是什么。问题不是营销总监。她很聪明。 她很有动力。 她正是你想要采用AI工具的人。 问题是安全路径比不安全路径慢。这是每个遗留访问程序的失败模式,我见过的。当管理路径比非管理路径更难时,人们会找到非管理路径。每次。你会在泄露时发现它,而不是在泄露之前。五个坟墓我已经看到组织尝试五种不同的方法来解决这个问题,直到他们找到真正有效的方法。每种方法都由于同一个根源原因而失败:它们增加了摩擦而没有增加速度。第一个尝试是让每个团队选择自己的AI工具。结果是十四个重叠的订阅和零审计跟踪。你已经民主化了采用,但集中了什么都没有。第二个尝试是把一切都放在SSO后面。SSO解决了登录问题。SSO不解决行为问题。一旦代理被认证,你的SSO层就对它接下来做什么了无所知。第三个尝试是共享一个服务帐户给代理。一次事件后,你就有零归属。你无法判断哪个代理在什么时候做了什么,当事情出错时。第四个尝试是编写一个AI政策并将其发布在wiki上。我看到一个组织花了六周时间制作了一个全面的AI可接受使用政策,向所有员工分发,然后三个月后发现不到三分之一的员工打开了该文档。没人读文档。人们读默认值。任何容易做的事情就是会被做的——而wiki页面永远不是容易的。第五个尝试是为每个AI项目建立一个集中审查委员会。你认为你很负责。你只是制造了瓶颈。在一个季度内,团队就会绕过你——你就创造了你试图防止的暗影AI问题。每一个坟墓都有相同的墓志铭:凭据散落在笔记本电脑上,没有审计跟踪,还有很多交叉手指。真正有效的逆转解决方案不是增加更多的摩擦。它是一个逆转。传统的安全性通过制造摩擦来防止不良行为。用户会绕过它。暗影AI出现。你会在泄露时发现它。逆转它。让提供的路径比未管理的路径更快。在实践中,这是什么样子?同样的营销总监——而不是与Python和服务帐户搏斗——从她的AI助手内部请求Google Analytics访问权限。请求击中一个策略引擎。低风险,已知工具,已知用户——自动批准。凭据被保管,范围和短暂。它永远不会触及她的笔记本电脑。每个查询都被记录下来。她在不到一分钟的时间内运行报告。同一个人。相同的结果她想要的。时间的一小部分。完整的审计跟踪。不同的激励。不同的结果。这就是AI访问管理的样子,当它被正确构建时。最快的路径成为最安全的路径。规避IT的激励消失——不因为你强制执行了合规性,而是因为你使合规性比另一个选择更容易。当你的管理路径真正比非管理路径更快时,暗影AI开始自行解决。衡量重要的事这里有一个永远不会消失的指标:管理路径是否比未管理路径更快?未管理路径比管理路径更快的那一刻,暗影AI就会回来,你就得从头开始。这不是一次性测量。这是一个持续的信号。每次你添加一个步骤,一个审查,一个批准——问问自己是否刚刚使未管理路径更具吸引力。自助服务不是一个生产力特性。这是一个安全特性。那一行颠倒了大多数安全团队对访问管理的思考方式,这是我能提供的最重要的重构。摩擦制造风险——每一次。如果你想要一个行为,设定它为默认值。如果你不想要一个行为,使它比另一个选择更难。按照这个原则构建,并且大部分暗影AI问题都会自行解决。

  • AI-generated image (GPT-2 + Photoshop): High-angle view of a man holding a scale model of the Leaning Tower of Pisa on a grassy field, with an inset photograph showing the same model aligned from ground level to resemble the full-sized tower in the background. AI-generated image (GPT-2 + Photoshop): High-angle view of a man holding a scale model of the Leaning Tower of Pisa on a grassy field, with an inset photograph showing the same model aligned from ground level to resemble the full-sized tower in the background.
    Anderson 视角1 day ago

    AI 在识别地标大小方面的挣扎

    视觉语言模型理解纪念碑,但它们仍然无法看到整个图景…… 我们发展的最早的生存技能之一是区分事物大小或远近的能力。我们可以用拇指遮住月亮,而不认为它的大小像一毛钱,因为我们已经内化了相对规模的理解。这对计算机视觉系统来说是一个异常艰难的任务,因为大多数系统依赖于先前的注释,这并不帮助它们像人类一样“理解”规模。况且,超过一定限度,视觉范围以外的所有事物都超出了立体视觉的解析能力——停车场远端的汽车;远处的摩天大楼;以及在其上升起的新月……所有这些对于大多数基于视觉的机器学习系统来说都是“2D”实体。当然,当一个特定的“遥远”但被误解的物体的例子出现在训练数据中,已经看到过这些数据的系统很难被欺骗:如果一个模型的训练潜在空间中不包含这样的特定和经常重复的信息,它就需要能够概括和内化我们在年轻时掌握的规模概念。没有这一点,即使是著名的例子也可能导致规模估计错误:像埃菲尔铁塔这样的特定和非常独特的物体的危险在于,系统会使用一个捷径来估计大小,这个捷径对原始模型是正确的,但不适用于埃菲尔铁塔的多个复制品,这些复制品与原版一样超出了立体视觉的距离,但大小远远不及原版。因此,视觉系统需要以准备好的技能集来处理新颖(未见过)的视图,而不是仅仅依靠“作弊码”。扩大规模为此,美国和中国之间的新合作提供了一个补救数据集,以及一个估计方法,来解决这个问题:与伴随网站一起推出的《MetricScenes》计划包括数据和代码发布。该论文指出*:‘我们发现当前最先进的方法经常无法估计正确的场景规模,从而导致“野外”场景中持续的规模坍缩现象。 ‘上图显示了一个例子,其中清晰的语义参考(人)存在,但模型如MoGe-2在距离范围内表现出显著的规模不一致:近距离物体的预测度量规模是合理的——在这种情况下,游客的高度是合理的——但远距离结构的规模被严重低估——这里,背景中的凯旋门被预测为仅18.8米宽,这比实际宽度(44.8米)小了2倍以上。 ‘MoGe-2 提出了一个微型化的地标,尽管有相反的提示。’三个的力量作者的新集合是通过组合三个现有的数据集而成:MegaScenes、AerialMegaDepth 和 Stereo4D:这些数据集单独使用时存在的问题是,它们每个都适用于有限的领域,例如车载摄像头拍摄的视频或室内场景,而要解决这个问题并使视觉系统更接近人类风格的规模概念理解,需要一个组合的领域。每张图像都伴有RGB图像、从结构从运动(SfM)、多视图立体视觉(MVS)或其他几何先验中获得的部分观察到的深度,以及通过新的两阶段泊松完成过程生成的完成深度图,以及相关的相机元数据。微调 MoGe-2 框架在新数据集上“显著缓解”作者所指的规模坍缩,据称在开放域场景中实现了更好的结果,并在相关基准测试中实现了最先进的性能。该论文题为《亲爱的,我缩小了凯旋门!》,由康奈尔大学和上海交通大学的四位研究人员撰写。方法MetricScenes 部分基于前面提到的 AerialMegaDepth 和 MegaScenes —— 互联网照片的两个集合,涵盖历史档案、旅游图片和专业摄影。虽然 MegaScenes 提供了大规模的结构从运动(SfM)重建,但这些场景缺乏任何内在的真实世界规模。为了解决这个问题,使用在线地图服务的地理标记图像来将重建与已知的物理位置和尺寸对齐。相反,AerialMegaDepth 已经包含了地理标记的谷歌地球视图,提供了具有度量规模的标志性物体重建。由于视觉上相似但地理位置遥远的结构可能导致的潜在重建错误,使用了 MASt3R-SfM 和 Doppelgangers++ 分类器进行了处理。在多视图立体视觉(MVS)重建之后,使用 MoGe-2 的预测和稳定性检查的组合来过滤掉不稳定的深度估计和深度出血伪影:然后通过地理参考图像恢复了度量规模。AerialMegaDepth 已经从捕获自已知位置的谷歌地球渲染中推导出规模,而 MegaScenes 则使用在线地图服务的地理标记街景级图像对齐到真实世界的尺寸。这些图像与现有重建使用...

  • 思想领袖1 day ago

    企业人工智能缺乏工作力能力地图

    各个行业的公司都在购买人工智能工具,启动试点项目,并鼓励员工进行实验。这种势头是不可否认的。但是,问大多数领导团队一个简单的运营问题,答案就会变得模糊:哪些人在您的组织中可以使用人工智能来提高工作效率,同时保持风险在可控范围内?2026年的自动化焦虑报告是一项针对1,500名全职美国工人的全国调查,发现69%的受访者认为他们当前工作的某些部分可能在24个月内被人工智能自动化。在预计会受到影响的受访者中,只有38%的人觉得自己能够有效地使用人工智能工具。另外40%的人表示需要培训,22%的人表示他们将难以或无法有效地使用人工智能工具。这就是企业领导者现在需要管理的工作力准备差距。人工智能的采用已经非常普遍。然而,领导者是否对所需的人力能力有一个明确的认识却不那么明确。在变革工作中,模式是连贯的:准备就绪的可见信号会在运营纪律之前到来。人工智能已经从工具访问转向工作重构人工智能采用早期阶段集中在访问上。领导者专注于分发工具和检查培训模块。下一个阶段需要更艰难的东西:了解员工是否可以在真实工作流中,在真实约束下,带来真实的业务后果地应用人工智能。微软2026年工作趋势指数支持这种领导者思考准备就绪的转变。微软发现,人工智能周围的组织环境,从文化到管理者支持到人才实践,占据了个人心态和行为报告的AI影响的两倍以上。这一发现重新定义了对话。工具访问只给领导者提供了一个部分的信号。考虑一下这在实际操作中是什么样子。一个员工可能知道如何提示聊天机器人,但仍然难以在监管环境中验证输出。一个经理可能会鼓励团队使用人工智能,而不知道哪些工作流需要在任何东西发布之前进行人工审查。一个团队可能看起来已经准备好使用人工智能,因为每个人都有许可,但实际的运营模式仍然没有改变。这种模式出现在每一次技术转型中。工具被快速引入。工具周围的管理系统则慢慢跟进。没有管理系统,采用只会产生活动,而不是价值。人工智能技能现在影响谁看起来更有前途人工智能能力已经成为一个筛选信号。它决定了谁在组织内部和整个劳动力市场中看起来更有前途。2026年由Stephany、Teutloff和Leone进行的一项研究发现,人工智能技能增加了大约8到15个百分点的面试邀请概率,跨越了测试职业。 当一个能力带有如此大的分量时,它开始塑造整个工作力的呈现方式。调查数据为这个信号添加了一个具体的维度。 在工人中,71%列出了至少一个人工智能技能,而只有34%的工人说他们可以自信地以专业水平执行所有列出的技能。 这个差距应该被视为一个信号质量问题。 领导者需要比“人工智能熟练”这样的标签更好的证据。第一步是定义。领导者需要停止将人工智能能力视为一种普遍的特征,开始将其定义为与工作本身相关。对于特定工作流程和特定角色,人工智能准备就绪是什么样的?这个问题让组织更清楚地了解能力在哪里存在,在哪里仍在发展。企业风险是糟糕的工作力规划在规模上,能力可见性的差异会在整个企业中累积。2025年麦肯锡全球人工智能状况报告发现,人工智能的使用范围扩大,但成长的烦恼仍然存在。大多数组织从试点到规模化影响的转变仍然是一个正在进行的工作。表现良好的公司更有可能重新设计工作流程,并定义何时需要人工验证模型输出。工作力数据显示出类似的雇主端可见性差距:64%的工人表示他们的雇主没有测试他们的人工智能技能,只有39%的工人认为雇主可以有效地验证这些技能。没有这种可见性,工作力规划就会开始依赖于假设。下游成本是具体的。错误的人被分配到人工智能启用的项目。团队被高估或低估。角色被重新设计以适应假设的技能,这些技能可能不存在,晋升取决于在实践中从未观察到的感知人工智能能力。高管不需要另一个模糊的人工智能成熟度标签。他们需要对谁能做什么、风险在哪里以及什么证据支持决策有一个更清晰的运营视图。董事会应该问这个问题,紧随“我们在哪里使用人工智能?”之后:“我们在哪里依赖于尚未绘制的人力能力?”公司需要人工智能能力地图实际的做法是,在规划之前绘制能力。这个地图从两个基础问题开始:人工智能可以在哪里应用,谁具备应用它的能力?然后,它分层添加工作所需的判断、工作流程所带来的风险以及证明能力真实的证据。结果是一个比培训完成报告或经理印象更有用的运营图景。地图分为五个层次。它首先是任务暴露:确定角色中哪些部分最受人工智能影响,因为那是工作首先发生变化的地方。第二,工具熟练度:人员是否可以在实际工作流程中使用批准的人工智能工具?使用一般用途的聊天机器人是一种技能,使用领域特定的人工智能工具在合规或临床系统中是一种不同的技能。第三,判断质量:人员是否能够评估人工智能输出是否准确、是否适合业务环境、是否存在偏差风险?输出验证是决定人工智能辅助工作是否经得起审查的人类技能。第四,数据纪律:人员是否了解什么信息可以和不能进入人工智能系统?赌注从知识产权暴露到客户数据违规到监管违规等都有。第五,结果证据:人工智能使用是否产生了工作的可衡量改进?改进可能表现为更快的周转时间、更高的输出准确率或更好的决策。培训完成和简历关键词为领导者提供了一个起点,但这种能力视图告诉他们这个起点是否与任何运营事项相关。能力映射必须与风险相关人工智能能力标准应根据工作流程中的风险而有所不同。总结内部会议记录是一个低风险的使用案例,需要基本的工具熟练度。草拟面向客户的沟通内容则更重要,需要输出审查。当工作支持招聘或财务决策时,或者当它涉及医疗保健或法律领域时,应在风险最高的检查点处内置记录的人类判断。NIST人工智能风险管理框架提供了一个有用的治理锚点。NIST要求组织评估其人工智能系统是否安全可靠;是否过程透明且可解释输出;以及是否内置公平和隐私保护。该框架要求组织根据后果的严重程度来匹配严谨程度,而不是为每个工作流程规定单一标准。后果越高,组织就需要更多证据证明应用人工智能的人员能够行使合理的判断并保护敏感数据。该人员还需要知道何时独立验证输出以及何时升级。任何在合规或治理领域工作过的人都认识到这一原则:高风险过程需要可审计的记录和明确的责任制在定义的检查点。人工智能准备就绪的公司将更好地了解其工作力工人期望人工智能会改变他们的工作。采用已经非常普遍,能力信号很嘈杂,雇主的可见性有限。成功采用人工智能的组织将是那些能够建立更清晰、更诚实的员工能力图景的组织。培训记录和简历关键词是有用的输入。经理印象也是如此。这些信号加强了当工作力能力视图将它们连接到实际工作流程、相关风险和证明准备就绪的结果时。人工智能采用下一阶段将奖励那些能够清晰地看到其现有员工并就其现有人员做出更好决策的公司。

  • 访谈1 day ago

    沙龙·本-列维,AudioCodes 全球销售和业务发展副总裁,联系中心 – 采访系列

    沙龙·本-列维,AudioCodes 全球销售和业务发展副总裁,联系中心,是一位具有超过 25 年经验的资深通信技术高管,曾在销售、营销、业务发展和联系中心创新等领域工作。 在 AudioCodes 任职超过 20 年期间,他曾担任多个高级领导职务,专注于推动企业通信、客户体验解决方案和 AI 驱动的联系中心技术的增长。 在加入 AudioCodes 之前,他曾在 NICE Systems 工作,获得了宝贵的客户参与和企业软件经验。 在他的整个职业生涯中,本-列维专注于帮助组织通过云通信、自动化和对话式 AI 现代化客户互动,使他成为联系中心技术演变的知名声音。AudioCodes 是一家专门从事企业语音、联系中心和 AI 驱动的客户体验解决方案的通信技术公司。 该公司成立于 1993 年,已经从语音网络和...

  • 人工智能2 days ago

    DocLang 致力于成为 AI 准备文档的通用语言

    几十年来,企业一直依赖于为人类读者而非 AI 系统设计的文档格式。合同、发票、报告、演示文稿、表格 和无数其他商业文档包含有价值的信息,但从中提取知识以供 AI 应用程序使用通常需要复杂的处理管道,这增加了成本、延迟和错误的可能性。随着组织越来越多地部署生成式 AI 和自主代理,这种脱节变得越来越具有挑战性。为了解决这个问题,ABBYY 与 IBM、NVIDIA、Red Hat、HumanSignal 和 Linux 基金会的 LF AI & Data 基金会合作推出了 DocLang,这是一种新的开放标准,旨在为 AI 系统创建文档的本地表示。该计划的支持者认为,它可以在企业 AI 中发挥与 HTML 标准化网页内容类似的作用,创建一个共同的语言,使...

  • 访谈2 days ago

    LawVu联合创始人兼首席执行官萨姆·基德 – 采访系列

    萨姆·基德,LawVu的首席执行官和联合创始人,是一位经验丰富的科技企业家,他的职业生涯跨越了SaaS、法律科技、金融科技、网络安全和数字产品开发。自2015年联合创立LawVu以来,他领导了公司的发展,成为一个全球性的法律运营平台,供内部法律团队使用,以管理合同、事项、法律支出和工作流程,从而实现单一系统的管理。加入LawVu之前,基德曾在Teamwork.com担任产品传播者,帮助推动世界领先的项目管理平台的采用。在他的早期职业生涯中,他创立并领导了多家公司,包括安全软件公司Zingtech,他在那里帮助开发了针对银行和在线服务的欺诈预防和身份验证技术,以及数字化团队,一家网络应用开发公司。他的创业背景还包括视频制作、在线游戏和会计技术方面的业务,这使他在多个行业中积累了丰富的软件公司建设和扩张经验。LawVu是一款法律运营平台,旨在帮助内部法律团队集中和管理其法律工作,从而实现单一系统的管理。该平台将事项管理、合同生命周期管理、法律支出跟踪、文档管理、工作流程和报告等功能整合在一个统一的工作空间中。通过取代零散的工具、电子表格和基于电子邮件的流程,LawVu使法律部门能够更有效地与整个业务进行合作,同时提高了对法律运营的可见性。该平台与广泛使用的企业应用程序集成,旨在帮助组织简化法律工作流程、提高效率、降低成本,并通过数据驱动的决策获得更深入的运营洞察。您在传统法律实践之外开始了您的职业生涯,从产品传播到科技业务,但后来创立了LawVu。您在法律团队运营中看到了什么样的差距,促使您为一个您最初不是其一部分的行业建立一个平台?不来自法律界可能是我拥有的最大优势。在创立LawVu之前,我在爱尔兰的一家项目管理软件公司工作了多年。当我出售了我在那家公司的股份时,这是我第一次发现自己处于法律过程的另一端。看到的景象令人惊讶,但不是以好的方式呈现的。整个过程缺乏可见性。电子邮件来来往往,文档散落在驱动器和收件箱中,很难清晰地了解发生了什么以及事情的进展如何。一开始,我以为这只是因为我不习惯与律师打交道。但是,当我开始与内部法律团队更广泛地交谈时,我不断听到同样的故事。法律团队正在做非常重要的工作,但这些工作却被困在断开的系统中。几乎没有可见性、结构或与法律部门轻松互动的方式。那时我意识到这不是一个孤立的问题,而是一个行业范围的问题。局外人的视角很重要。一个在这些流程中度过了整个职业生涯的律师经常学会了如何在这些流程中工作。但我没有。我没有接受这样一个观点,即这就是法律运营的方式。相反,我不断地问为什么。为什么法律工作不能像其他关键的商业功能一样被管理?为什么如此多的知识被锁定?为什么很难了解法律团队正在做什么以及他们创造的价值?这些问题最终成为LawVu的基础。LawVu将收集和事项管理、合同生命周期管理以及支出跟踪整合到一个系统中。对于今天的企业环境来说,拥有法律运营的单一真实来源有多重要?LawVu就是建立在拥有单一真实来源的重要性的基础上。目前,大多数法律团队都在处理单独的系统,用于收集、事项、合同、支出和文档。当一切都存储在不同的地方时,您就无法获得清晰的图景。人工智能只有在统一的系统中运行时才会有效,否则它将缺乏上下文,输出结果也会受到影响。但是,当人工智能在具有法律功能全貌的统一系统中运行时,您将获得普通工具无法提供的东西。这也会带来真正的速度差异。当一切都相互连接时,团队不必花费一半的时间来跟踪分散在不同的工具和收件箱中的信息;他们实际上可以利用这些信息来做出决定。治理也变得可能,尤其是在数据分散时,这对于合规、审计以及越来越多地了解人工智能在法律功能中实际上做了什么至关重要。LawVu扩展了其人工智能能力,包括合同分析和起草。在法律工作流程中,您认为人工智能将产生最直接的影响,以及哪里仍然被高估?人工智能最直接的影响是对高容量、重复性的工作的影响,例如合同审查、子句提取、初步摘要和跨大型文档集快速查找信息。然后是起草。通过LawVu Draft,我们将智能起草直接集成到平台中。它利用您的先例、最佳子句、游乐书等,所有这些都是您的团队多年来积累的机构知识。对于标准的高容量合同,人工智能辅助起草已经显著减少了周转时间。人工智能处理生产工作,但它是由您的团队已经应用的判断力驱动的。更细致、更高风险的工作仍然需要律师介入,这是律师应该花费时间的地方。人工智能的炒作超过了现实的程度是任何与判断而非流程相关的事情。法律本质上是一种判断职业,对于内部律师来说,这种判断是基于对公司目标和计划的广泛了解。人工智能在模式识别方面非常出色,但内部律师赚取报酬的地方并不是由人工智能单独解决的。随着您最近的收购专注于人工智能驱动的合同能力,您认为合同智能将如何在未来几年内改变组织管理风险和合规的方式?收购更多地是关于将合同智能融入工作流程,而不是一个单独的工具。目前,大多数组织通过让律师手动阅读合同并标记问题来管理合同风险。这个过程无法扩大,因为它很慢,会留下空白。当人工智能可以在整个合同组合中持续提供风险信号时,您可以开始更早地发现问题。做对这一点的组织将开始将其合同数据视为战略资产,而不是法律档案。谁是我们签约的对象?我们在哪些管辖区有哪些义务?我们在哪里暴露?这些情报一直存在,但它们生活在太耗时的合同中,无法系统地阅读。现在,通过人工智能,您可以利用它们为自己谋利。许多企业都在努力应对法律瓶颈,导致商业决策变慢。更好的法律基础设施如何加速公司范围内的执行,而不是成为一个限制因素?企业在法律方面犯下的最大错误是将其视为最后一步。某事物被决定,一个交易被结构化,一个产品被构建,然后它被发送给法律部门进行批准。但到那时,法律部门已经无法提供帮助了。他们只能减慢速度或说不。那些已经解决了这个问题的团队将法律部门纳入决策过程的开始阶段,就像他们会涉及财务或运营一样。当法律部门知道即将发生的事情时,他们可以帮助塑造决策,而不是只是对已经做出的决定做出反应。更好的基础设施使这成为可能。当收集有结构时,当工作可见时,当正确的模板可用时,业务可以自行服务于简单的请求时,法律部门有带宽参与其中,而不是只是处理输出。一位客户最近告诉我,他们从需要等待的东西变成了业务真正想要参与的东西。而这并不是来自于雇用更多的律师。这来自于建立一个让法律部门能够像业务的真正组成部分一样运作的系统,而不是业务末端的门槛。您已将LawVu扩展到服务全球组织,跨越数十个国家。构建一个可在不同法律体系、文化和监管环境中工作的产品的最大挑战是什么?我们学到的最重要的一课是,虽然世界各地的法律团队面临着许多相同的挑战,但他们的运作方式可能会有很大差异。美国、英国、德国、澳大利亚或日本的法律团队可能都在管理合同、请求、事项、法律支出,但他们的流程、监管要求,甚至对技术的期望可能会有很大差异。早期,我们意识到我们不能建立一个假设只有一个“正确”方式让法律团队工作的平台。这就是为什么我们构建了LawVu,使其核心高度可配置,而不是关于流程的意见。该平台需要适应每个法律团队的运作方式,同时仍然保持直观和易用性。这听起来很简单,但这是一个很难做对的平衡,这也是许多企业软件挣扎的地方。另一个挑战是确保我们可以为客户提供相同的服务水平,无论他们位于哪里。我们不认为我们的产品只是软件。它是技术、专业知识和支持的结合,这些因素推动了成功。我们的全球支持团队全天候运作,平均在30秒内响应客户问题。这对于法律团队来说至关重要,因为他们经常在处理时间敏感的事务,并需要在需要时获得帮助的信心。最终,我们的方法是构建一个灵活的平台,可以适应本地差异,同时为每个客户提供一致的体验和服务标准,无论他们在世界的哪个地方。在LawVu之前,您参与了会计技术和互联网平台公司的建设。这些经历如何塑造您在法律运营中构建SaaS产品的方法?我在LawVu之前的经历教会了我,伟大的软件不仅仅是关于技术,而是关于解决人们深切关心的问题。在SaaS早期工作教会了我简单性、用户采用和创建客户真正喜欢使用的产品的重要性。当我进入法律领域时,我带来了这些教训。我没有把法律技术看作是一堆专用工具,而是看作一个机会,去建立一个平台,使法律工作更加可见、相互连接和易于管理。也许最重要的是,这些经历教会了我始终专注于客户。最好的SaaS公司之所以获胜,是因为他们异常出色地解决了真正的问题,这是一个自LawVu成立以来就指导我们的原则。展望未来,您是否相信法律操作系统将成为企业技术栈中的核心层,类似于CRM或ERP系统,未来会是什么样子?二十年前,大多数公司都在电子表格中管理客户关系,并认为这是可以接受的。这种转变发生在领导层意识到这在规模上不可持续,并且电子表格中的数据实际上是战略性的。法律现在正处于同样的转折点,在很多组织中,它已经发生了。每家公司都有合同、法律义务和合规要求。当CFO或CEO询问业务有多少活跃合同、外部法律支出总额或监管暴露情况时,如果答案是“我们需要去找”,那么您就有一个系统问题,无法通过法律人才来解决它。我们正在建设的未来,将法律操作系统置于CRM和ERP旁边,作为业务运营的核心部分,连接销售工作流程、财务和产品。现在投资于这一基础的组织将拥有更好的数据、更快的决策和降低风险的复合优势。感谢这次精彩的采访,希望了解更多的读者可以访问LawVu。

More Posts
Page 1 of 39812345Next ›Last »
  • 首页
  • 团队介绍
  • 我们的章程
  • 媒体工具
  • 联系我们

广告披露:Unite.AI 致力于遵循严格的编辑标准,为读者提供准确的信息和新闻。当您点击我们评测产品的链接时,我们可能会获得报酬。

Copyright © 2026 Unite.AI

  • 编辑政策
  • 条款与条件