证券投资软件_证券配资网站_证券配资平台
你的位置:证券投资软件_证券配资网站_证券配资平台 > 证券投资软件 > 配资杠杆什么意思 浪潮云姚超:DeepSeek爆火的思考与行动
发布日期:2025-04-02 22:06 点击次数:86
2025年春节,DeepSeek凭借高性能、低成本的优势,迅速在全球范围内引发关注。DeepSeek的爆火,不仅推动了AI技术的普惠化,还对全球AI产业格局产生了深远影响。
2月17日,由浪潮云主办的“海若讲堂”第九场直播特别邀请到浪潮海若大模型首席架构师姚超,与我们深度聚焦热门案例,以爆火的DeepSeek为讨论对象,详细剖析其发展历程、创新技术、应用场景,让听众深入了解这一热门AI案例,紧跟行业前沿趋势。
Q:为什么DeepSeek会突然爆火?
姚超:这一成绩的取得并非偶然,背后有着多方面的关键因素。
模型性能好:DeepSeek-V3在多项评测中超越一众开源模型和闭源模型。尤其DeepSeek-R1在数学、代码、自然语言推理等任务上,具备显著优势。
模型开源开放:DeepSeek通过开放模型权重文件,允许商业机构免费使用、修改和二次分发。这一举措不仅推动了人工智能技术的开源生态发展,也让更多开发者和企业能够基于DeepSeek的模型进行创新,降低了技术门槛,加速了AI技术在各个领域的应用和普及。
使用成本低:DeepSeek-V3的完整训练成本仅为557.6万美元,远低于业界平均水平。此外,DeepSeek的网页和APP免费使用,注册流程简便,无需复杂验证,用户能够即时注册并使用。
Q:在行业应用DeepSeek落地的过程中碰到了哪些问题?
姚超:在使用DeepSeek进行行业应用落地时,也碰到了一些挑战:
模型与数据安全:政府的应用场景对安全性要求极高,开源模型漏洞若未及时修补,可能会被攻击者利用,政务数据上传至政务网以外也存在安全风险。
运营与运维问题:开源模型下载完并不能直接使用,需要考虑模型部署和运维人员投入,包括联网等功能需要另外开发,可参考“谁建设谁运维”的模式,由云厂商来承担相关工作。
软件与硬件适配:DeepSeek在英伟达GPU上完成了训练,在国产GPU上需要进行适配,以满足国产化需求。
模型幻觉问题:DeepSeek虽然在大部分任务中表现优异,但由于其开源性质和广泛的适用性,它可能没有针对某些特定领域(如政务领域)进行深度学习。R1目前提供的上下文长度为64K token,在对话时可以通过检索增强(RAG)的方式读取部分文档内容来增强回答,以弥补模型幻觉问题。
Q:浪潮云积极拥抱DeepSeek做了哪些工作?
姚超:浪潮云以“云上MaaS+一体机+行业智能体”为抓手,软硬结合。推出基于DeepSeek的MaaS服务、海若一体机及智能体应用,叠加端到端模型安全服务保障,为政府用户提供基于DeepSeek大模型智能应用落地的一体化解决方案。
基于DeepSeek的Maas服务:
云上MaaS:依托政务云上线DeepSeek R1等模型,提供模型微调、推理等服务。
专享MaaS:基于DeepSeek的智能体创新平台,提供预装DeepSeek大模型和海若智能体平台的一站式交付服务。
预装DeepSeek的海若一体机:
基于DeepSeek的海若一体机主要包括硬件、模型、海若智能体操作系统AgentOS和智能体应用4个部分。
硬件适配了海若睿智610、海若灵智310、晟腾910B、L20、H20等10余款GPU芯片,满足不同算力需求;预装AgentOS(智能体操作系统),帮助用户快速创建智能体,并且可以接入海若大模型和DeepSeek等主流模型,可依据需求灵活选配行业应用。
针对组织用户的多样场景需求,海若一体机面向DeepSeek模型推出四种规格,预装14B、32B,70B,671B四种参数的DeepSeek大模型,用户可根据业务场景灵活选型,实现精度与效率的最佳平衡。
智能体应用增强:
智能体创新应用:基于DeepSeek的模型能力,结合硬件终端,打造新型智能体终端。
智能体应用增强:借助DeepSeek先进的推理机制,优化智能体的推理算法,提高响应速度;对智能体的对话策略进行重新训练,提升智能体服务质量。
Q:浪潮海若大模型有哪些技术服务可以让组织用户更好地使用DeepSeek?
姚超:通过预装DeepSeek大模型,为用户提供海若智能体操作系统(AgentOS)来帮助其生成和管理智能体。同时,还为用户提供通用智能体应用和行业智能体应用。
海若智能体操作系统(AgentOS):
海若智能体操作系统AgentOS是定位为智能体生产、管理的操作系统级产品,能提升智能体开发效率,异构兼容且允许多模型接入,内置模型池适配多种算力架构。开放易用,支持零代码/低代码构建,内置多种典型行业智能体。提供40余种工具,支持自定义工具接入。在安全可靠方面,有知识库细粒度权限管控,提供私有化部署方案。
海若智能体:
海若智能体是为用户交付切实可用且具备高价值的智能化应用。
通用智能体应用:主要面向多样化的办公场景,提供综合性的办公工具。不仅具备联网搜索、知识问答、文档处理等基础且实用的办公能力,还支持Web、H5、APP等多种不同终端的用户访问,极大地提升用户使用的便捷性。此外,能够无缝集成主流办公平台,实现办公生态的深度融合。
行业智能体应用:这是专门针对垂直领域专有场景而设计的智能化应用。涵盖了政务、水利、应急等多个关键领域场景,为各行业的智能化升级提供强大的驱动力。
在行业智能体的开发过程中,我们首先基于具体的行业场景,精准选择合适的模型(基于场景选模型),确保模型与场景的高度适配;其次,基于AgentOS对相应的工作流进行合理编排,以此构建出功能完备、性能卓越的智能体;最后,将构建好的智能体集成到系统之中,或者作为独立应用向用户提供服务,为用户带来更优质、更智能的体验。
Q:浪潮海若大模型的产品有哪些?
姚超:浪潮海若大模型的产品包括海若大模型工厂、模型层、海若智能体。
海若大模型工厂:从明确需求、数据汇集、数据清洗、模型训练、模型调优、模型评测,最终成为大模型产品并提供推理服务。
模型层:支持多种大模型,包括海若大模型,DeepSeek等开源大模型以及第三方商业大模型。
海若智能体:包括智能体操作系统(AgentOS)和基于AgentOS开发出来的智能体应用。AgentOS具备模型接入管理、工作流编排、知识库、工具调用、技能融合等多方面能力,其涵盖智能体开发的全流程关键功能模块。AgentOS支撑起众多智能体应用,像通用领域的知识问答、智能创作,行业领域的应急指挥调度、景区智能导览,还有不同终端的应用,如智能会议终端、应急智能终端等。
Q:浪潮海若大模型的整体业务架构是什么?
姚超:浪潮海若大模型的整体业务是构建“1+N”智能引擎生态,通过融入DeepSeek等多种大模型能力,为用户提供MaaS服务+云资源服务、行业智能应用和本地可运营智能体云服务。基于海若智能体来实现边端协同管理,提供行业级智能体终端产品、通用智能体终端和智能体一体机等解决方案,涵盖政务、应急、水利、农业等多个领域等,为组织用户的智能化发展提供支持。
责任编辑:张润邦配资杠杆什么意思
Powered by 证券投资软件_证券配资网站_证券配资平台 @2013-2022 RSS地图 HTML地图