Andrew Gibbs-Bravo 是 Phrasee 的数据科学家,专注于改进 Phrasee 世界领先的 AI 驱动的文案写作技术。他也是伦敦强化学习社区聚会的联合组织者,并对所有与强化学习、自然语言处理和机器学习相关的事情感兴趣。
在写作或交谈时,我们都曾经想过是否有更好的方式来向他人传达我们的想法。我们应该使用什么词语?如何构建我们的思维?他们可能会如何回应?在 Phrasee ,我们花了很多时间思考语言 – 什么有效,什么无效。想象一下,你正在为一封电子邮件活动编写主题行,这封邮件将发送给你的名单中的 1000 万人,促销一款新款笔记本电脑的 20% 折扣。你会选择哪一行: 您现在可以在下一次订单中额外享受 20% 的折扣 准备好了 – 额外 20% 的折扣 虽然它们传达相同的信息,但其中一行实现了几乎 15% 更高的打开率(我打赌你无法击败我们的模型来预测哪一个?)。虽然语言可以通过 A/B 测试 或 多臂老虎机 进行测试,但自动生成隐喻仍然是一个具有挑战性的研究问题。如果两句话具有相同的含义并且可以互换使用,则认为它们是彼此的隐喻。另一个常常被忽视的重要事项是,机器生成的句子是否通顺。与监督学习不同,强化学习(RL)代理通过与环境交互并观察结果奖励来学习。这一细微的差异对算法的工作方式和模型的训练有着巨大的影响。 深度强化学习...