OpenAI出品的Whisper 是一种自动语音识别 (ASR) 系统,经过 680,000 小时的多语言和多任务监督数据训练;Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训...
DALL·E 2 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品
LLaVA:大型语言和视觉助手;LLaVA 代表了一种新颖的端到端训练大型多模态模型,该模型结合了视觉编码器和 Vicuna 以实现通用视觉和语言理解,实现了令人印象深刻的聊天功能,模仿多模态 GPT-4 的精神,并在科学 QA 上设置了新的最先进的准确性。
该存储库包含 Stability AI 正在进行的 StableLM 系列语言模型开发,并将不断更新新的检查点。以下提供了所有当前可用模型的概述。
ChatGLM(内测版)是一个具有问答、多轮对话和代码生成功能的中英双语模型,基于千亿基座 GLM-130B 开发,通过代码预训练、有监督微调等技术提升各项能力,敬请期待新能力涌现。
CharacterGPT 是世界上第一个能够根据自然语言描述生成交互式 AI 角色的多模态 AI 系统,它获得了重大升级,增强了其理解力、生成能力、输出多样性以及创建更高保真度角色的能力。
M6是中文社区最大的跨模态预训练模型,模型参数达到十万亿以上,具有强大的多模态表征能力。M6通过将不同模态的信息经过统一加工处理,沉淀成知识表征,为各个行业场景提供语言理解、图像处理、知识表征等智能服务