Warning: Array to string conversion in /www/wwwroot/mojier.com/wp-content/themes/onenav/inc/wp-optimization.php on line 108
认知预训练模型官网 - CogVideo是目前最大的通用领域文本到视频生成预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的，旨在通过理解和转换文本描述来生成相应的视频内容。CogVideo能够处理大量的文本-视频对数据，并通过学习这些数据的模式来生成与文本描述相匹配的视频 | 魔戒 R丨掌上纳戒-收纳一切

Loading...

认知预训练模型

1年前发布 7,724 0 0

CogVideo是目前最大的通用领域文本到视频生成预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的，旨在通过理解和转换文本描述来生成相应的视频内容。CogVideo能够处理大量的文本...

所在地：

中国

收录时间：

2025-01-05

打开网站手机查看

认知预训练模型

认知预训练模型

CogVideo是目前最大的通用领域文本到视频生成预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的，旨在通过理解和转换文本描述来生成相应的视频内容。CogVideo能够处理大量的文本-视频对数据，并通过学习这些数据的模式来生成与文本描述相匹配的视频。

数据统计

相关导航

百度智能云客悦

百度智能云客悦是基于百度文心大模型重构的智能客服系列产品，提供智能客服系统、高拟人智能外呼、对话洞察平台及智能通信平台等丰富功能，致力于成为全行业客户的智能服务首选

讯飞星火大模型

讯飞星火大模型，是由科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务，提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。

Mistral AI

Mistral AI 是一家来自法国的人工智能服务商，由前 DeepMind 和 Meta 公司的研究人员组建的新公司。他们专注于大型语言模型和生成式人工智能的构建、培训和应用。Mistral AI 的目标是与 OpenAI 和谷歌竞争，为企业开发生成式人工智能基础设施。Mistral AI | Frontier AI in your hands

书生·浦语

书生·浦语 InternLM 是由商汤科技与上海AI实验室联合香港中文大学和复旦大学共同开发的新一代大型语言模型。它是在过万亿token数据上训练的多语千亿参数基座模型，具有较高的知识水平，尤其在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀。它能够处理超长的文本，支持多种语言，并且在多个领域，如阅读理解、推理任务等，表现出色。InternLM 的设计理念是提高语料质量和信息密度，从而提升模型的语言建模能力。

DeepSeek 国内知名 ai

DeepSeek,以好奇心揭开通用人工智能（AGI）的奥秘。用长远主义解答关键问题。 unravel the mystery of AGI with curiosity. Answer the essential question with long-termism.

千帆大模型

企业级一站式大模型与AI原生应用开发及服务平台，百度智能云千帆大模型平台提供最全面易用的生成式人工智能模型开发、微调、应用开发全流程工具链

Sora

Sora是一个能以文本描述生成视频的人工智能模型，由美国人工智能研究机构OpenAI开发。它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频，其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。并在单个生成视频中创建多个镜头，准确保留角色和视觉风格。

腾讯混元

腾讯混元大模型是由腾讯研发的大语言模型，具备跨领域知识和自然语言理解能力，实现基于人机自然语言对话的方式，理解用户指令并执行任务，帮助用户实现人获取信息，知识和灵感。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...