提示工程
生成式人工智能在金融领域:FinGPT、BloombergGPT 及其未来

生成式人工智能是指可以生成与输入数据类似的新数据样本的模型。ChatGPT 的成功为各个行业带来了许多机遇,激励企业设计自己的大型语言模型。数据驱动的金融领域现在比以往任何时候都更加依赖数据。
我在一家法国金融服务公司担任数据科学家,已经工作了一年多。最近,我观察到公司各个部门对大语言模型(LLM)的使用大幅增加,用于任务自动化和构建强大的安全人工智能系统。
每家金融服务公司都旨在使用像 LLAMA 2 或 Falcon 这样的开源模型来创建自己的定制 LLM。尤其是那些拥有几十年金融数据的传统银行。
到目前为止,尚不可能将大量数据整合到一个模型中,因为计算资源有限,模型参数较少。然而,这些开源模型具有数十亿个参数,可以对大量文本数据进行 微调。数据是这些模型的燃料;数据越多,结果越好。
数据和 LLM 模型都可以通过提高自动化、效率、准确性等方面为银行和其他金融服务机构节省数百万美元。
据麦肯锡最近的估计,生成式人工智能可能为银行业带来高达 3400 亿美元的年度节省。
BloombergGPT 和生成式人工智能的经济学
2023 年 3 月,彭博公司展示了 BloombergGPT。它是一个从头开始构建的语言模型,具有 50 亿个参数,专门为金融数据定制。
为了节省资金,有时需要花费资金。训练像 BloombergGPT 或 Meta 的 Llama 2 这样的模型并不便宜。
训练 Llama 2 的 700 亿参数模型需要 170 万个 GPU 小时。在商业云服务中,使用 Nvidia A100 GPU(用于 Llama 2)每个 GPU 小时的费用可能在 1-2 美元之间。计算一下,一个 10 亿参数的模型可能需要 15 万美元,而一个 100 亿参数的模型可能需要高达 150 万美元。
如果不租用,可以考虑直接购买 GPU。然而,购买大约 1000 个 A100 GPU 来形成一个集群可能需要超过 1000 万美元。
彭博公司投资超过一百万美元尤其值得关注,因为人工智能领域正在迅速发展。令人惊讶的是,一款仅花费 100 美元的模型在半年内就超越了 BloombergGPT 的性能。虽然 BloombergGPT 的训练使用了专有数据,但其数据集的绝大多数(99.30%)是公开可访问的。于是,FinGPT 应运而生。
FinGPT
FinGPT 是一个最先进的金融领域大语言模型(FinLLM)。由 AI4Finance-Foundation 开发,FinGPT 目前在成本效益和准确性方面优于其他模型。
它目前有 3 个版本;FinGPT v3 系列使用 LoRA 方法改进,并使用新闻和推文来分析情绪。它们在许多金融情绪测试中表现最佳。FinGPT v3.1 基于 chatglm2-6B 模型,而 FinGPT v3.2 基于 Llama2-7b 模型。
FinGPT 的运作:
- 数据来源和工程:
- 数据采集:FinGPT 从雅虎、路透社等可靠来源获取数据,汇集了大量的金融新闻,涵盖了美国股票到中国股票等广泛的范围。
- 数据处理:这些原始数据经过多个阶段的清理、标记化和提示工程,以确保其相关性和准确性。
- 大语言模型(LLM):
- 训练:使用这些数据,LLM 不仅可以微调以创建轻量级模型以满足特定需求,而且现有的模型或 API 也可以被改造以支持各种应用。
- 微调策略:
- 张量层(LoRA):开发像 FinGPT 这样的模型面临的一个关键挑战是获得高质量的标记数据。认识到这一挑战,FinGPT 采用了一种创新方法。与其仅依赖传统标记,FinGPT 使用市场驱动的股票价格波动作为标记,将新闻情绪转化为有形标记,如正面、负面或中立。这大大提高了模型的预测能力,特别是在区分正面和负面情绪方面。通过 LoRA 等微调技术,FinGPT v3 在优化性能的同时减少了计算开销。
- 从人工反馈中进行强化学习:FinGPT 使用 “RLHF(从人工反馈中进行强化学习)“。这是一项 BloombergGPT 中缺乏的功能,RLHF 为 LLM 模型提供了识别个性化偏好的能力——无论是用户的风险承受能力、投资模式还是定制的机器人顾问设置。这项技术是 ChatGPT 和 GPT4 的基石,确保了更个性化和直观的用户体验。
- 应用和创新:
- 机器人顾问:FinGPT 可以分析新闻情绪并预测市场趋势,类似于一位经验丰富的金融顾问。
- 量化交易:通过识别来自各个来源的新闻情绪,FinGPT 可以制定有效的交易策略。事实上,即使仅依靠 Twitter 情绪,FinGPT 也表现出有前途的交易结果。
FinGPT 的当前轨迹和未来:2023 年 7 月是 FinGPT 的一个重要里程碑。该团队发布了一篇题为 “Instruct-FinGPT:通过通用大语言模型的指令调优进行金融情绪分析” 的研究论文。该论文的核心是探索指令调优,一种使 FinGPT 能够执行复杂金融情绪分析的技术。
但 FinGPT 并不局限于情绪分析。事实上,FinGPT 还有 19 个其他多样化的应用,每个应用都承诺以新的方式利用大语言模型。从提示工程到理解复杂的金融背景,FinGPT 正在金融领域确立自己作为一种多功能的生成式人工智能模型。
全球银行如何接受生成式人工智能
2023 年初,像 Bank of America、Citigroup 和 Goldman Sachs 这样的主要金融玩家限制了员工使用 OpenAI 的 ChatGPT,而其他行业对手则决定采取更开放的态度。
例如,摩根士丹利 将 OpenAI 驱动的聊天机器人集成到其金融顾问的工具中。通过利用公司的内部研究和数据,这些聊天机器人充当了丰富的知识资源,增强了金融咨询的效率和准确性。
今年 3 月,对冲基金 Citadel 正在谈判获取企业范围的 ChatGPT 许可。拟议的实施旨在增强软件开发和复杂信息分析等领域。
摩根大通 也正在利用大语言模型来检测欺诈。他们的方法涉及使用电子邮件模式来识别潜在的安全漏洞。该银行还设定了一个雄心勃勃的目标:到今年年底使用人工智能创造高达 15 亿美元的价值。
至于高盛,他们并没有完全抵制人工智能的诱惑。该银行正在探索生成式人工智能在软件工程领域的力量。正如高盛首席信息官 Marco Argenti 所说,这种集成有可能将他们的员工变成 “超人“。
金融和银行业中生成式人工智能的应用场景
生成式人工智能从根本上改变了金融运营、决策和客户互动。以下是其应用的详细探索:
1. 欺诈防范: 生成式人工智能处于开发尖端欺诈检测机制的前沿。通过分析大量数据,它可以识别复杂的模式和异常,提供更主动的方法。传统系统经常被数据量所淹没,可能会产生假阳性。生成式人工智能则不断完善其理解,减少错误,确保更安全的金融交易。
2. 信用风险评估: 传统的评估借款人信用度的方法虽然可靠,但正在变得过时。生成式人工智能模型通过多种参数——从信用历史到微妙的行为模式——提供了一个全面的风险概况。这不仅确保了更安全的贷款,也满足了包括那些可能被传统指标低估的人在内的更广泛的客户群体。
3. 增强客户互动: 金融世界正在经历客户服务的革命,多亏了生成式人工智能驱动的 NLP 模型。这些模型能够理解和响应各种客户查询,提供个性化的解决方案。通过自动化常规任务,金融机构可以降低成本、简化运营,并最重要的是提高客户满意度。
4. 个性化金融: 一刀切的方法已经过时。今天的客户要求根据他们的独特需求和愿望量身定制的金融规划。生成式人工智能在这里表现出色。通过分析数据——从消费模式到投资偏好——它为客户制定了个性化的金融路线图。这种整体方法确保客户更好地了解自己的金融未来,并更有能力应对挑战。
5. 算法交易: 生成式人工智能的分析能力在算法交易的动荡世界中证明了其价值。通过分析数据——从市场趋势到新闻情绪——它提供了深刻的见解,使金融专家能够优化策略、预测市场转变并减轻潜在风险。
6. 加强合规框架: 反洗钱(AML)法规对于维护金融系统的完整性至关重要。生成式人工智能通过筛选复杂的交易数据来识别可疑活动,使合规变得更容易。这种方法不仅确保金融机构遵守全球标准,还显著减少了假阳性的可能性,简化了运营。
7. 网络安全: 随着网络威胁不断演变,金融行业需要灵活的解决方案。生成式人工智能提供了这种解决方案。通过实施动态预测模型,它使威胁检测更快,保护金融基础设施免受潜在的网络攻击。
然而,像任何新兴技术一样,生成式人工智能在金融行业也带来了挑战。
挑战
- 偏见放大: 人工智能模型尽管很先进,但仍依赖于人类生成的训练数据。这些数据中固有的偏见——无论是故意还是无意的——都可能导致偏差的结果。例如,如果训练集中某个人群代表性不足,人工智能的后续输出可能会延续这种忽视。在像金融这样的行业中,公平和公正至关重要,这样的偏见可能会带来严重的后果。金融领导者需要积极识别这些偏见,并确保他们的数据集是尽可能全面和代表性的。
- 输出可靠性和决策: 生成式人工智能有时会产生错误和误导性的结果——通常被称为 “幻觉“。这些失误在人工智能模型改进和学习的过程中是可以预见的,但在金融领域中,精度至关重要,后果将非常严重。仅仅依靠人工智能进行关键决策,例如贷款批准,是危险的。相反,人工智能应该被视为一种可以协助金融专家的工具,而不是取代他们。它应该处理计算负担,为人类专业人士提供洞察力,以便他们做出最终的、明智的决定。
- 数据隐私和合规性: 保护敏感的客户数据仍然是生成式人工智能应用中的一个重大问题。确保系统遵守 GDPR 和 CCPA 等全球标准至关重要。人工智能可能本身并不了解或尊重这些界限,因此其使用必须受到严格的数据保护指南的调节,特别是在金融领域,保密性至关重要。
- 输入数据质量: 生成式人工智能的好坏取决于输入的数据质量。不准确或不完整的数据可能会无意中导致次优的金融建议或决策。
结论
从增强交易策略到加强安全性,生成式人工智能的应用是广泛而变革性的。然而,像对待任何技术一样,必须谨慎地对待其采用,考虑其伦理和隐私影响。
那些成功利用生成式人工智能的机构,同时尊重其局限性和潜在陷阱,将无疑塑造全球金融领域的未来轨迹。



