5月10日,中科深智在北京正式发布GenSense数智姜尚大模型,该模型除了适用于虚拟直播、数字员工等成熟场景外,还可进一步适用于对私有化部署需求更高的金融、医疗、政企等专业领域。
(相关资料图)
自从今年3月以来,国内一些大厂已陆续推出大模型,数智前线了解到,很多客户提出深度定制、低成本等应用诉求,大厂大模型很难一一满足。一家企业有时需要多个模型用于不同场景,这也催生国内垂直领域企业开发多元化模型。
2016年成立的中科深智,一直围绕端到端生成式AI虚拟人技术展开业务。中科深智创始人兼CEO成维忠认为,在虚拟人市场,大模型能让虚拟人与人的交流,有了面对面的感觉,这有非常大的意义。CTO宋健介绍,未来希望能为每家客户提供定制化服务。
01 大模型改变虚拟人市场
数智前线获悉,中科深智从2020年初开始基于transformer来做训练模型。这让其具备较早在垂直领域推出大模型的能力。
中科深智创始人兼CEO成维忠
成维忠介绍,数字人未来升级的一个核心,就是希望能变成一个真正意义上有“人设”的人,拥有符合身份和职业背景的学识,不仅有标准动作,还有符合他特点的动作、思维、表情和语言组织。这是中科深智未来半年到一年的核心,从而形成一个完整意义上的人。
成维忠认为,ChatGPT对整个虚拟人市场的影响比想象中要大得多。GenSense数智姜尚是针对垂直领域,以及虚拟人专门设计的大语言模型,将能填补以往数字人只能“依照”指令进行反馈、而无“自主”互动能力的缺陷,成为虚拟人真正意义上的“大脑”,为其提供实时互动能力支撑。
而基于中科深智此前积累的跨多模态深度学习算法——CLAP算法,能够将虚拟人的“大脑”和形体表现进一步有机融合:由GenSense数智姜尚大模型对外界互动作出实时反馈、并直接驱动虚拟人进行生动地表达,复现一个有“智力”、有良好表现力和表达能力的3D虚拟人。这个组合让用户发现,虚拟人也是可以做实时交互的。
02 未来为每家客户提供定制
GenSense数智姜尚大模型更加轻巧便利,本场展示的分别是200亿和20亿两种参数量的大模型,占用资源相比前者极少,甚至只需要一块NVIDIA GeForce RTX 3090显卡便能良好运行。 此前,千亿大模型在企业应用时,遇到了推理速度较慢、算力消耗比较大的问题。
这也是国内商用大模型在轻量化领域内的首次尝试,有特别重要的商业意义。 GenSense数智姜尚大模型更加适合对数据安全性要求更高的金融、医疗、政企、能源等行业用户进行私有化部署应用。
中科深智认为,未来应对每家客户提供定制,比如,在电商行业,大家卖不同的产品,需要针对不同企业提供精调,大模型不但有整个电商行业的通识,也要与客户核心业务、流程结合。
03 端到端实时3D虚拟人服务能力
宋健介绍,客户定制不需要懂任何技术。只要讲数据提交,模型就可以帮他来干。这些用于精调的数据,都是客户日常运营中已经有的数据,比如直播的文稿、商品定价、商品描述、弹幕等。
数智前线获悉,中科深智已实现自有大模型、自主核心算法、系列3D AIGC产品、生成式AI虚拟人解决方案的“全家桶”级服务能力。
此前其基于自主核心算法、生成式AI虚拟人和Motionverse业务中台等底层技术,打造的超写实虚拟人生成系统Anyhuman,以及元宇宙电商百宝箱——自动播,支持电商全平台3D虚拟人主播、虚拟直播间、虚拟人客服、虚拟人直播助理等可视化RPA功能,可以大幅增强虚拟人电商直播交互及时性、播报趣味性,在电商直播领域服务客户3000+家,市占率超70%。
而对于更广泛的行业用户,中科深智提供了基于生成式AI技术的3D AIGC动画视频创作平台——自动画,是包括虚拟人捏脸、自动生成虚拟场景、自动生成物品等一站式3D动画创作平台。
此外还有一款高效的虚拟人实时交互产品——云小七,支持自定义虚拟人形象和声音,通过生成式AI技术实时驱动虚拟人表情和动作,还会说不同方言。
通过以上底层技术和产品,中科深智可以SaaS和PaaS模式、或提供垂直领域解决方案,赋能不同行业和场景,实现了基于生成式AI提供全流程、端到端3D虚拟人服务的战略目标。