标签:LLM

大模型创业淘汰潮开始了:这是第一个估值10亿美元的祭品

整理 | 凌敏、核子可乐 风雨飘摇中的 Stability AI 还能走多远? 近期,AI 绘画神器 Stable Diffusion 背后的开发公司 Stability AI 发生一系列变动,包括 C...

2080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍

作者:上交大IPADS实验室 投稿 转自:量子位 | 公众号 QbitAI 原本需要一张16万元的80G A100干的活,现在只需要一张不到2万元的24G 4090就够了! 上海交大IPA...

LLM大模型意味着人工智能的质变时刻已经到来!

作者 | 王启隆、唐小引出品 | CSDN(ID:CSDNnews) 【CSDN 编者按】在人工智能几经起落的发展史里,人工智能进化的里程碑式的演进中,我们总会看见百年企业 ...

LLM大模型时代,如何评估人工智能与人类智能?

编者按:LLM大模型时代的到来,使得人工智能成为了真正影响人类社会的重要技术之一,如何打造“负责任的人工智能”的问题正变得愈发迫切和关键。一直以来,微软...

通义千问能看图了!阿里云开源视觉语言大模型Qwen-VL ,支持图文双模态输入

继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。作者 | 凌敏阿里云开源通义千问多模态大模型 Q...

牛津大学等最新《视觉-语言基础模型的提示工程》LLM系统性综述

Prompt工程是一种技术,涉及用任务特定的提示,即prompts,增强大型预训练模型,以使模型适应新任务。提示可以作为自然语言指令手动创建,或者作为自然语言指...

斯坦福大学:LLM大模型“卷”错方向了?上下文窗口越长,模型越笨!

大数据文摘出品 在LLM语言模型中,上下文窗口对于理解和生成与特定上下文相关的文本至关重要。一般而言较大的上下文窗口可以提供更丰富的语义信息、消除歧义...

小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增

机器之心报道 编辑:陈萍、杜伟 大模型时代,各种优化方案被提出,这次吞吐量、内存占用大等问题被拿下了。 随着大语言模型(LLM)的不断发展,这些模型在...

GPT-4推理提升1750%!普林斯顿清华姚班校友提出全新「思维树ToT」框架,让LLM反复思考

  新智元报道   编辑:桃子 好困 【新智元导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架,让GPT-4可以自己提案、评估和决策,推理能力最高可...

有证据了,MIT表明:LLM大型语言模型≠随机鹦鹉,确实能学到语义

机器之心报道 LLM大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息?这一问题在计算机科学和自然语言处理领域一直存在争议。然而,MIT的一项新研究...