存根 金融领域的生成式人工智能:FinGPT、BloombergGPT 及其他 - Unite.AI
关注我们.

即时工程

金融领域的生成式人工智能:FinGPT、BloombergGPT 及其他

mm
更新 on
金融领域的生成式人工智能

生成式人工智能是指能够生成与输入数据相似的新数据样本的模型。 ChatGPT 的成功为各行业带来了许多机会,激励企业设计自己的大型语言模型。 由数据驱动的金融行业现在比以往任何时候都更加数据密集。

我在一家法国金融服务公司担任数据科学家。 在那里呆了一年多,我最近观察到所有部门的法学硕士用例在任务自动化和构建强大、安全的人工智能系统方面都有显着增加。

每个金融服务机构的目标都是使用开源模型打造自己的微调法学硕士,例如 美洲驼2 or 。 尤其是拥有数十年财务数据的传统银行。

到目前为止,由于有限的计算资源和不太复杂/低参数的模型,将如此大量的数据合并到单个模型中还不可行。 然而,这些具有数十亿参数的开源模型现在可以 微调 大量的文本数据集。 数据就像这些模型的燃料; 越多,结果就越好。

数据和法学硕士模型都可以通过提高自动化、效率、准确性等来为银行和其他金融服务节省数百万美元。

最近的估计 麦肯锡 表明这种生成式人工智能每年可以为银行业节省高达 340 亿美元的费用。

BloombergGPT 与生成式人工智能经济学 

2023 年 XNUMX 月,彭博社展示 彭博GPT。 它是一个从头开始构建的语言模型,拥有 50 亿个参数,专为金融数据量身定制。

为了省钱,有时就需要花钱。 像 BloombergGPT 或 Meta 的 Llama 2 这样的训练模型并不便宜。

训练 Llama 2 的 70 亿个参数模型需要 1,700,000 个 GPU 小时。 在商业云服务上,采用 英伟达 A100 GPU (用于 Llama 2)每 GPU 小时可节省 1-2 美元。 计算一下,一个 10 亿参数模型的成本可能约为 150,000 万美元,而一个 100 亿参数模型的成本可能高达 1,500,000 万美元。

如果不租用,直接购买 GPU 也是一种选择。 然而,购买大约 1000 个 A100 GPU 来组成一个集群可能会花费超过 10 万美元。

与人工智能的快速进步相比,彭博社超过 100 万美元的投资尤其令人大开眼界。 令人惊讶的是,一款售价仅为 99.30 美元的模型在短短半年内就超越了 BloombergGPT 的性能。 虽然 BloombergGPT 的培训纳入了专有数据,但其数据集的绝大多数 (XNUMX%) 都是可公开访问的。 来了 芬GPT.

芬GPT

FinGPT 是最先进的金融微调大语言模型 (FinLLM)。 FinGPT 由 AI4Finance-Foundation 开发,目前在成本效益和准确性方面均优于其他模型。

目前有3个版本; FinGPT v3 系列是使用 LoRA 方法改进的模型,它们接受新闻和推文训练以分析情绪。 他们在许多金融情绪测试中表现最好。 FinGPT v3.1 基于 chatglm2-6B 模型构建,而 FinGPT v3.2 基于 骆马2-7b型号。

 

芬格普特

芬格普特

FinGPT 的运营:

  1. 数据源和工程:
    • 数据采集:FinGPT 使用雅虎、路透社等知名来源的数据,合并了大量财经新闻,涵盖美国股票和中国股票。
    • 数据处理:这些原始数据经过多个阶段的清理、标记化和快速工程,以确保其相关性和准确性。
  2. 大型语言模型 (LLM):
    • 产品培训:使用精选的数据,法学硕士不仅可以根据特定需求进行微调以诞生轻量级模型,而且还可以调整现有模型或 API 以支持应用程序。
    • 微调策略:
      • 张量层 (劳拉):开发 FinGPT 等模型的关键挑战之一是获取高质量的标记数据。 FinGPT 认识到这一挑战,采取了创新方法。 不再仅仅依赖传统标签,而是采用市场驱动的股价波动作为标签,将新闻情绪转化为正面、负面或中性等有形标签。 这导致模型的预测能力得到巨大提高,特别是在辨别积极和消极情绪方面。 通过 LoRA 等微调技术,FinGPT v3 成功优化了性能,同时减少了计算开销。
      • 从人类反馈中强化学习:FinGPT 使用“RLHF(根据人类反馈进行强化学习)”。 RLHF 是 BloombergGPT 中所没有的功能,它使 LLM 模型能够识别个人偏好 - 无论是用户的风险偏好、投资模式还是定制的机器人顾问设置。 该技术是 ChatGPT 和 GPT4 的基石,可确保更加定制和直观的用户体验。
  3. 应用与创新:
    • 机器人顾问:就像经验丰富的财务顾问一样,FinGPT 可以非常精确地分析新闻情绪并预测市场趋势。
    • 定量交易:通过识别从新闻媒体到 Twitter 等不同来源的情绪,FinGPT 可以制定有效的交易策略。 事实上,即使仅受 Twitter 情绪的影响,它也展示了有希望的交易结果。
FinGPT 与 GPT-4 LLAMA 2 彭博 gpt 的比较

FinGPT 与 ChatGLM、LLAMA 2、BloombergGPT 的比较

FinGPT的现状与未来:2023 年 XNUMX 月标志着 FinGPT 的一个激动人心的里程碑。 该团队发表了一篇研究论文,题为“Instruct-FinGPT:通过通用大型语言模型的指令调整进行金融情绪分析”。 本文的核心是探索指令调整,这是一种使 FinGPT 能够执行复杂的金融情绪分析的技术。

但 FinGPT 不仅仅局限于情绪分析。 事实上,还有其他 19 个不同的申请可供选择,每个申请都承诺以新颖的方式利用法学硕士。 从快速工程到理解复杂的金融环境,FinGPT 正在将自己打造成金融领域的多功能 GenAI 模型。

全球银行如何拥抱生成式人工智能

2023 年伊始,美国银行、花旗集团和高盛等一些主要金融机构对其员工使用 OpenAI 的 ChatGPT 施加了限制,但业内的其他同行显然选择了更为包容的立场。

摩根士丹利例如,该公司已集成 OpenAI 支持的聊天机器人作为其财务顾问的工具。 通过利用公司广泛的内部研究和数据,这些聊天机器人可以作为丰富的知识资源,提高财务咨询的效率和准确性。

今年XNUMX月, 对冲基金城堡 正在努力获取企业范围内的 ChatGPT 许可证。 预期的实施设想支持软件开发和复杂信息分析等领域。

摩根大通 还致力于利用大型语言模型进行欺诈检测。 他们的方法围绕利用电子邮件模式来识别潜在的危害。 银行并没有就此止步,还制定了一个雄心勃勃的目标:增加高达  到今年年底人工智能价值将达到 1.5 亿美元.

至于高盛,他们并没有完全抵制人工智能的诱惑。 该银行正在探索生成式人工智能的力量,以强化其软件工程领域。 作为 Marco Argenti,高盛首席信息官,指出,这种整合有可能将他们的劳动力转变为“超人设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“

生成式人工智能在银行和金融行业的用例

金融领域的生成式人工智能用例

金融用例中的生成式人工智能

生成式人工智能正在从根本上改变财务运营、决策和客户互动。 以下是对其应用的详细探索:

1. 欺诈预防: 生成式人工智能处于开发尖端欺诈检测机制的最前沿。 通过分析大量数据池,它可以识别复杂的模式和不规则之处,从而提供更主动的方法。 传统系统常常被海量数据淹没,可能会产生误报。 相比之下,生成式人工智能不断完善其理解,减少错误并确保更安全的金融交易。

2、信用风险评估: 评估借款人信用的传统方法虽然可靠,但正在变得过时。 生成人工智能模型通过不同的参数(从信用历史到微妙的行为模式)提供全面的风险概况。 这不仅确保了更安全的贷款,还满足了更广泛的客户需求,包括那些可能无法通过传统指标获得服务的客户。

3. 增强客户互动: 得益于人工智能驱动的 NLP 模型,金融界正在见证客户服务的一场革命。 这些模型善于理解和响应不同的客户查询,及时提供个性化解决方案。 通过自动化日常任务,金融机构可以减少管理费用,简化运营,最重要的是,提高客户满意度。

4. 个性化财务: 一刀切的做法已成为过去。 当今的客户需要根据他们独特的需求和愿望量身定制的财务规划。 生成式人工智能在这方面表现出色。 通过分析从支出模式到投资偏好的数据,它制定了个性化的财务路线图。 这种整体方法可确保客户更好地了解情况并更有能力驾驭他们的财务未来。

5. 算法交易: 事实证明,生成式人工智能的分析能力在动荡的算法交易世界中具有无价的价值。 通过剖析从市场趋势到新闻情绪的数据,它提供了深刻的见解,使金融专家能够优化策略、预测市场变化并降低潜在风险。

6. 加强合规框架: 反洗钱 (AML) 法规对于维护金融体系的完整性至关重要。 生成式人工智能通过筛选复杂的交易数据来查明可疑活动,从而简化合规性。 这不仅确保金融机构遵守全球标准,而且还显着减少误报的可能性,简化运营。

7. 网络安全: 随着网络威胁不断演变,金融行业需要敏捷的解决方案。 生成式人工智能恰恰提供了这一点。 通过实施动态预测模型,它可以更快地检测威胁,加强金融基础设施以抵御潜在的违规行为。

然而,与任何不断发展的技术一样,生成式人工智能在金融行业也面临着一系列挑战。

面临的挑战

  1. 偏置放大: 人工智能模型虽然复杂,但仍然依赖于人类生成的训练数据。 这些数据及其固有的偏见(无论是有意还是无意)可能会导致结果出现偏差。 例如,如果特定人群在训练集中代表性不足,人工智能的后续输出可能会延续这种监督。 在金融这样的行业,公平和公正至关重要,这种偏见可能会导致严重后果。 财务领导者需要主动识别这些偏见,并确保他们的数据集尽可能全面和具有代表性。
  2. 输出可靠性和决策: 生成式人工智能有时会产生错误且具有误导性的结果——通常被称为“幻觉'。 随着人工智能模型的完善和学习,这些失误在某种程度上是意料之中的,但在精度不容妥协的金融领域,其影响是严重的。 仅仅依靠人工智能来做出关键决策(例如贷款审批)是危险的。 相反,人工智能应该被视为一种帮助金融专家的复杂工具,而不是取代他们的工具。 它应该处理计算量,为人类专业人员提供洞察力,以做出最终的、明智的决策。
  3. 数据隐私与合规性: 保护敏感的客户数据仍然是生成式人工智能应用程序的一个重要问题。 确保系统符合全球标准,例如 一般数据保护条例 (GDPR)和 加州消费者隐私法案 (CCPA) 至关重要。 人工智能可能本质上并不了解或尊重这些边界,因此其使用必须遵循严格的数据保护准则,特别是在保密性至关重要的金融领域。
  4. 输入数据的质量: 生成式人工智能的好坏取决于输入的数据。 不准确或不完整的数据可能会无意中导致低于标准的财务建议或决策。

结论

从增强交易策略到加强安全性,生成式人工智能应用范围广泛且具有变革性。 然而,与任何技术一样,必须谨慎采用它,并考虑道德和隐私影响。

那些成功利用生成式人工智能的力量,同时尊重其局限性和潜在陷阱的机构,无疑将塑造全球金融领域的未来轨迹。

在过去的五年里,我一直沉浸在机器学习和深度学习的迷人世界中。 我的热情和专业知识使我为 50 多个不同的软件工程项目做出了贡献,特别关注人工智能/机器学习。 我持续的好奇心也吸引了我对自然语言处理的兴趣,这是我渴望进一步探索的领域。