跳动百科

视觉语言模型导论

鲁锦晨
导读 机器之心报道编辑:Panda近些年,语言建模领域进展非凡。Llama或ChatGPT等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成...

机器之心报道编辑:Panda近些年,语言建模领域进展非凡。Llama或ChatGPT等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成为越来越常用的工具。这些模型之前基本都局限于文本输入,但现在也正在具备处理视觉输入的能力。