该存储库包含 Stability AI 正在进行的 StableLM 系列语言模型开发,并将不断更新新的检查点。以下提供了所有当前可用模型的概述。
OpenAI出品的Whisper 是一种自动语音识别 (ASR) 系统,经过 680,000 小时的多语言和多任务监督数据训练;Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。
领先市场的语言驱动深度学习大模型,快速准确处理语言表达。支持多种交互方式,满足语音、文本和对话需求。快速生成悦耳语音、高质量文本,与人机互动,序列猴子都将是最佳选择!
访问强大的 AI 模型来转录和理解语音我们简单的 API 公开了用于语音识别、说话人检测、语音摘要等的 AI 模型。我们以最新的最先进的 AI 研究为基础,通过简单的 API 提供生产就绪、可扩展且安全的 AI 模型。
LLaVA:大型语言和视觉助手;LLaVA 代表了一种新颖的端到端训练大型多模态模型,该模型结合了视觉编码器和 Vicuna 以实现通用视觉和语言理解,实现了令人印象深刻的聊天功能,模仿多模态 GPT-4 的精神,并在科学 QA 上设置了新的最先进的准确性。
M6是中文社区最大的跨模态预训练模型,模型参数达到十万亿以上,具有强大的多模态表征能力。M6通过将不同模态的信息经过统一加工处理,沉淀成知识表征,为各个行业场景提供语言理解、图像处理、知识表征等智能服务
Codex 是OpenAI为 GitHub Copilot 提供支持的模型。Codex精通十几种编程语言,现在可以用自然语言解释简单的命令并代表用户执行它们——这使得为现有应用程序构建自然语言界面成为可能。