大型语言模型 (LLM) 的重大进步激发了多模态大型语言模型 (MLLM) 的发展。早期的 MLLM 工作,例如 LLaVA、MiniGPT-4 和 InstructBLIP,...
准确解释复杂视觉信息的能力是多模态大型语言模型 (MLLM) 的关键重点。最近的研究表明,增强视觉感知可以显著提高...
大规模预训练以及随后针对特定任务的语言建模微调取得了显著成功,已将这种方法确立为标准做法。同样,计算机视觉方法也是……
当前的长上下文大型语言模型 (LLM) 可以处理多达 100,000 个标记的输入,但它们却难以生成超过 2,000 个长度的输出......
大型语言模型 (LLM) 越来越多地用于需要多次生成调用、高级提示技术、控制流和结构化输入/输出的复杂任务。然而,高效的系统...
训练前沿大型多模态模型 (LMM) 需要大规模数据集,其中包含自由格式的图像和文本交错序列。尽管开源 LMM 发展迅速,但仍存在一些问题...
2018年,在神经网络世界模型的背景下强化学习的想法首次被提出,很快,这个基础……
深度生成式人工智能模型的出现极大地加速了人工智能的发展,在自然语言生成、3D 生成、图像生成等方面表现出了卓越的能力。
LLM 水印将难以察觉但可检测的信号集成到模型输出中以识别由 LLM 生成的文本,这对于防止大型语言的滥用至关重要......
与其他方法相比,LoRA 或低秩自适应具有强大的性能和广泛的适用性,是最流行的 PEFT 或参数之一……
尽管 AutoML 几年前就开始流行,但 AutoML 的早期研究可以追溯到 90 年代初,当时科学家发表了第一篇论文……
大型语言模型的最新进展和进步经历了视觉语言推理、理解和交互能力的显着提高。现代框架通过...实现这一点
多模态大型语言模型(MLLM)的架构和性能的最新进展凸显了可扩展数据和模型对于增强...的重要性。
在现代机器学习和人工智能框架中,变压器是各个领域中使用最广泛的组件之一,包括 GPT 系列和 BERT...
最近尝试文本到视频或 T2V 生成的框架利用扩散模型来增加训练过程的稳定性,而视频扩散模型是...