Google Gemini Google Gemini是由谷歌推出的一款人工智能多模态大模型,于2023年12月6日发布。这个模型具有强大的功能,能够同时识别文本、图像、音频、视频和代码五种类型的信息。它还能理解并生成主流编程语言的高质量代码,如Python、Java、C++,并且进行了全面的安全性评估。这个模型标志着人工智能领域的一个重大突破,因为它不仅能够处理文本信息,还能理解图像、音频、视频和代码等多种类型的数据。Gemini模型分为三种规模:Ultra、Pro和Nano,适用于从大型数据中心到移动设备的各种场景。Bard is now Gemini. Get help with writing, planning, learning, and more from Google AI.
讯飞开放平台 讯飞开放平台,一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。我们不仅提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。
文心智能体平台AgentBuilder 文心智能体平台AgentBuilder,是百度推出的基于文心大模型的智能体平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可以通过prompt编排的方式低成本开发智能体(Agent),同时文心智能体平台还将为智能体(Agent)开发者提供相应的流量分发路径,完成商业闭环。
Segment Anything Segment Anything是一个基于深度学习的图像分割模型,它可以根据用户的输入提示(如点或框)生成高质量的物体遮罩。它可以用于为图像中的任何物体生成遮罩,无论是常见的物体(如人、车、猫等),还是罕见的物体(如火箭、恐龙、魔法棒等)。它的特点是具有强大的零样本性能,即它可以在没有见过的类别上进行分割,而不需要额外的训练数据。它的另一个优点是具有快速的推理速度,即它可以在几秒钟内处理一张图像,而不需要显卡或云计算资源。Segment Anything | Meta AI