HuggingFace推出的BigScience 大型开放科学开放存取多语言语言模型
Imagen,这是一种文本到图像的扩散模型,具有前所未有的逼真度和深层次的语言理解能力。 Imagen 建立在大型 Transformer 语言模型理解文本的能力之上,并依赖于扩散模型在高保真图像生成方面的优势。
OpenAI出品的Whisper 是一种自动语音识别 (ASR) 系统,经过 680,000 小时的多语言和多任务监督数据训练;Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。
MLC LLM 是一种通用解决方案,它允许将任何语言模型本地部署在一组不同的硬件后端和本地应用程序上,此外还有一个高效的框架,供每个人进一步优化自己用例的模型性能。一切都在本地运行,无需服务器支持,并通过手机和笔记本电脑上的本地 GPU 加速
Google推出的超过5400亿参数的大语言模型;PaLM 2 是一种最先进的语言模型,具有改进的多语言、推理和编码能力。
Watsonx.ai 将由基础模型和传统机器学习提供支持的新型生成 AI 功能整合到一个跨越 AI 生命周期的强大平台中。
LLaVA:大型语言和视觉助手;LLaVA 代表了一种新颖的端到端训练大型多模态模型,该模型结合了视觉编码器和 Vicuna 以实现通用视觉和语言理解,实现了令人印象深刻的聊天功能,模仿多模态 GPT-4 的精神,并在科学 QA 上设置了新的最先进的准确性。